Análisis de datos en Ambientes Big Data

SKU SINF-323

Sin existencias

Sin existencias

El curso se enfoca en el análisis de fuentes de datos grandes y complejas para descubrir tendencias, patrones, comportamientos para mejorar la toma de decisiones.

Programas profesionales relacionados

Descripción del curso

El curso se enfoca en el análisis de fuentes de datos grandes y complejas para descubrir tendencias, patrones, comportamientos para mejorar la toma de decisiones.


Contenidos

Tema 1. Introducción a Big Data
-Definición y origen de Big Data.
-Las 5 V’s del Big Data: Volumen, Velocidad, Variedad, Veracidad y Valor.
-Historia y evolución del Big Data.
-Desafíos y oportunidades en la era del Big Data.
-Diferencia entre datos tradicionales y Big Data.

Tema 2. Ecosistemas y plataformas de Big Data
-Introducción a Hadoop: concepto y componentes principales (HDFS y YARN).
-MapReduce: funcionamiento y aplicaciones prácticas.
-Apache Spark: introducción, RDD y diferencias con Hadoop.
-Herramientas de streaming en tiempo real: Kafka y su rol en Big Data.
-Bases de datos NoSQL: características, tipos y ejemplos.

Tema 3. Procesamiento avanzado y almacenamiento de Big Data
-Procesamiento de datos con Spark: Spark SQL y DataFrames.
-Streaming con Spark: procesamiento en tiempo real y estructurado.
-Bases de datos NoSQL: uso práctico y ventajas frente a sistemas SQL.
-Almacenamiento en la nube: proveedores, ventajas y desafíos.
-Estrategias de respaldo y recuperación en ambientes de Big Data.

Tema 4. Análisis y exploración de datos en entornos de Big Data
-Herramientas de análisis: uso y características de Jupyter y Zeppelin.
-Técnicas de análisis estadístico adaptadas a Big Data.
-Visualización de datos: herramientas y desafíos en contextos de Big Data.
-Exploración y preprocesamiento: limpieza y transformación de datos.

Tema 5. Técnicas y Herramientas Avanzadas de Analítica de Datos
-Introducción al Machine Learning: algoritmos escalables y herramientas.
-Analítica Predictiva.
-Visualización Avanzada de Datos.
-Optimización y Simulación.
-Analítica de Texto y Procesamiento de Lenguaje Natural (NLP).

Tema 6. Aplicaciones reales y futuro del Big Data y analítica de datos
-Análisis de sentimiento: extracción de percepciones en redes sociales.
-Sistemas de recomendación basados en Big Data: funcionamiento y aplicaciones.
-Desafíos actuales en el análisis de datos masivos.
-Tendencias futuras y áreas de innovación en el ámbito del Big Data.
-Aspectos éticos y regulaciones en Big Data: GDPR, CCPA y otros marcos regulatorios.
-Mejores prácticas para la gestión responsable de la información.


Metodología de Aprendizaje

La educación actual suele limitar a estudiantes, forzándoles a absorber contenidos en lugar de fomentar la solución colectiva de problemas. En CENFOTEC, buscamos modificar este enfoque mediante nuestra metodología de aprendizaje constructivista llamada 40-40-20.

La técnica 40-40-20 divide el tiempo de clase: 40% el profesor da un charla para inducir al pensamiento autónomo basado en conceptos clave; el siguiente 40% para resolver retos individuales o en grupo, que exigen exploración, donde el docente es un facilitador; y el 20% restante para una discusión guiada por el profesorado. Para mantener la atención, consideramos 1 hora lectiva como 50 minutos, especialmente en cursos de 3-4 horas.

Adicionalmente el estudiante deberá dedicar una cantidad de horas adicionales para completar retos extraclase que el profesor le asigne.


Información adicional

Fecha de inicio

Horario

Profesor

Área de formación

Sistemas de información.

Modalidad

Virtual en Vivo

Duración

16 horas.

Nivel de complejidad

Avanzado.

Perfil de ingreso

-Conocimiento de SQL, Excel avanzado Power BI y Tableau.
-En caso de no contar con los conocimientos, debe aporbar: SOFT-315 Introducción a Bases de Datos.