Análisis de Datos en Ambientes Big Data

SKU SINF-690

Sin existencias

Sin existencias

El Big Data consiste en el conjunto de tecnologías y prácticas de recolección, almacenamiento, procesamiento y análisis de grandes volúmenes de datos los cuales no pueden ser manejados con herramientas tradicionales.

Programas profesionales relacionados

Descripción del curso

El Big Data consiste en el conjunto de tecnologías y prácticas de recolección, almacenamiento, procesamiento y análisis de grandes volúmenes de datos los cuales no pueden ser manejados con herramientas tradicionales.

Las principales temáticas por abordar son la introducción al Big Data, los ecosistemas y las plataformas, el procesamiento avanzado de datos, el análisis y la exploración de datos y las técnicas, las aplicaciones y las herramientas del Big Data.

El curso está diseñado por competencias y alineado con el marco global de habilidades y competencias para un mundo digital SFIA8, por lo que se propone que los estudiantes logren responder a un nivel de responsabilidad 2 en el área de Ciencia de Datos (DATS), de manera que analizan e informan los hallazgos, y soluciona problemas simples mediante algoritmos implementados en los marcos y las herramientas de software estándar.


Contenidos

Tema 1. Introducción a Big Data
-Definición y origen de Big Data.
-Las 5 V’s del Big Data: Volumen, Velocidad, Variedad, Veracidad y Valor.
-Historia y evolución del Big Data.
-Desafíos y oportunidades en la era del Big Data.
-Diferencia entre datos tradicionales y Big Data.


Tema 2. Ecosistemas y plataformas de Big Data
-Introducción a Hadoop: concepto y componentes principales (HDFS y YARN).
-MapReduce: funcionamiento y aplicaciones prácticas.
-Apache Spark: introducción, RDD y diferencias con Hadoop.
-Herramientas de streaming en tiempo real: Kafka y su rol en Big Data.
-Bases de datos NoSQL: características, tipos y ejemplos.


Tema 3. Procesamiento avanzado y almacenamiento de Big Data
-Procesamiento de datos con Spark: Spark SQL y DataFrames.
-Streaming con Spark: procesamiento en tiempo real y estructurado.
-Bases de datos NoSQL: uso práctico y ventajas frente a sistemas SQL.
-Almacenamiento en la nube: proveedores, ventajas y desafíos.
-Estrategias de respaldo y recuperación en ambientes de Big Data.

Tema 4. Análisis y exploración de datos en entornos de Big Data
-Herramientas de análisis: uso y características de Jupyter y Zeppelin.
-Técnicas de análisis estadístico adaptadas a Big Data.
-Visualización de datos: herramientas y desafíos en contextos de Big Data.
-Exploración y preprocesamiento: limpieza y transformación de datos.


Tema 5. Técnicas y Herramientas Avanzadas de Analítica de Datos
-Introducción al Machine Learning: algoritmos escalables y herramientas.
-Analítica Predictiva.
-Visualización Avanzada de Datos.
-Optimización y Simulación.
-Analítica de Texto y Procesamiento de Lenguaje Natural (NLP).


Tema 6. Aplicaciones reales y futuro del Big Data y analítica de datos
-Análisis de sentimiento: extracción de percepciones en redes sociales.
-Sistemas de recomendación basados en Big Data: funcionamiento y aplicaciones.
-Desafíos actuales en el análisis de datos masivos.
-Tendencias futuras y áreas de innovación en el ámbito del Big Data.
-Aspectos éticos y regulaciones en Big Data: GDPR, CCPA y otros marcos regulatorios.
-Mejores prácticas para la gestión responsable de la información.


Metodología de Aprendizaje

La educación actual suele limitar a estudiantes, forzándoles a absorber contenidos en lugar de fomentar la solución colectiva de problemas. En CENFOTEC, buscamos modificar este enfoque mediante nuestra metodología de aprendizaje constructivista llamada 40-40-20.

La técnica 40-40-20 divide el tiempo de clase: 40% el profesor da un charla para inducir al pensamiento autónomo basado en conceptos clave; el siguiente 40% para resolver retos individuales o en grupo, que exigen exploración, donde el docente es un facilitador; y el 20% restante para una discusión guiada por el profesorado. Para mantener la atención, consideramos 1 hora lectiva como 50 minutos, especialmente en cursos de 3-4 horas.

Adicionalmente el estudiante deberá dedicar una cantidad de horas adicionales para completar retos extraclase que el profesor le asigne.


Información adicional

Fecha de inicio

Horario

Profesor

Área de formación

Sistemas de información.

Modalidad

Virtual en Vivo

Duración

16 horas.

Nivel de complejidad

Avanzado

Perfil de ingreso

-Bachillerato en Educación Media y edad de 18 años cumplidos en adelante.
-Se requiere haber completado el curso SOFT-690 Introducción a Bases de Datos.