Descripción del curso
El curso se enfoca en el análisis de fuentes de datos grandes y complejas para descubrir tendencias, patrones, comportamientos para mejorar la toma de decisiones.
Contenidos
Tema 1. Introducción a Big Data
-Definición y origen de Big Data.
-Las 5 V’s del Big Data: Volumen, Velocidad, Variedad, Veracidad y Valor.
-Historia y evolución del Big Data.
-Desafíos y oportunidades en la era del Big Data.
-Diferencia entre datos tradicionales y Big Data.
Tema 2. Ecosistemas y plataformas de Big Data
-Introducción a Hadoop: concepto y componentes principales (HDFS y YARN).
-MapReduce: funcionamiento y aplicaciones prácticas.
-Apache Spark: introducción, RDD y diferencias con Hadoop.
-Herramientas de streaming en tiempo real: Kafka y su rol en Big Data.
-Bases de datos NoSQL: características, tipos y ejemplos.
Tema 3. Procesamiento avanzado y almacenamiento de Big Data
-Procesamiento de datos con Spark: Spark SQL y DataFrames.
-Streaming con Spark: procesamiento en tiempo real y estructurado.
-Bases de datos NoSQL: uso práctico y ventajas frente a sistemas SQL.
-Almacenamiento en la nube: proveedores, ventajas y desafíos.
-Estrategias de respaldo y recuperación en ambientes de Big Data.
Tema 4. Análisis y exploración de datos en entornos de Big Data
-Herramientas de análisis: uso y características de Jupyter y Zeppelin.
-Técnicas de análisis estadístico adaptadas a Big Data.
-Visualización de datos: herramientas y desafíos en contextos de Big Data.
-Exploración y preprocesamiento: limpieza y transformación de datos.
Tema 5. Técnicas y Herramientas Avanzadas de Analítica de Datos
-Introducción al Machine Learning: algoritmos escalables y herramientas.
-Analítica Predictiva.
-Visualización Avanzada de Datos.
-Optimización y Simulación.
-Analítica de Texto y Procesamiento de Lenguaje Natural (NLP).
Tema 6. Aplicaciones reales y futuro del Big Data y analítica de datos
-Análisis de sentimiento: extracción de percepciones en redes sociales.
-Sistemas de recomendación basados en Big Data: funcionamiento y aplicaciones.
-Desafíos actuales en el análisis de datos masivos.
-Tendencias futuras y áreas de innovación en el ámbito del Big Data.
-Aspectos éticos y regulaciones en Big Data: GDPR, CCPA y otros marcos regulatorios.
-Mejores prácticas para la gestión responsable de la información.
Metodología de Aprendizaje
La educación actual suele limitar a estudiantes, forzándoles a absorber contenidos en lugar de fomentar la solución colectiva de problemas. En CENFOTEC, buscamos modificar este enfoque mediante nuestra metodología de aprendizaje constructivista llamada 40-40-20.
La técnica 40-40-20 divide el tiempo de clase: 40% el profesor da un charla para inducir al pensamiento autónomo basado en conceptos clave; el siguiente 40% para resolver retos individuales o en grupo, que exigen exploración, donde el docente es un facilitador; y el 20% restante para una discusión guiada por el profesorado. Para mantener la atención, consideramos 1 hora lectiva como 50 minutos, especialmente en cursos de 3-4 horas.
Adicionalmente el estudiante deberá dedicar una cantidad de horas adicionales para completar retos extraclase que el profesor le asigne.
Información adicional
Fecha de inicio | – |
---|---|
Horario | – |
Profesor | – |
Área de formación | Sistemas de información. |
Modalidad | Virtual en Vivo |
Duración | 16 horas. |
Nivel de complejidad | Avanzado. |
Perfil de ingreso | -Conocimiento de SQL, Excel avanzado Power BI y Tableau. |
Cursos relacionados