Descripción del curso
La minería de datos se define como el proceso de exploración y análisis de grandes conjuntos de datos para el descubrimiento de patrones ocultos, tendencias y relaciones que pueden ser útiles para la toma de decisiones organizacionales.
Las principales temáticas por abordar son la minería de datos, las herramientas matemáticas y estadísticas, el procesamiento de datos y el análisis y visualización de los datos.
El curso está diseñado por competencias y alineado con el marco global de habilidades y competencias para un mundo digital SFIA8, por lo que se propone que los estudiantes logren responder a un nivel de responsabilidad 3 en el área de Ciencia de Datos (DATS), de manera que aplica técnicas de ciencia de datos existentes a nuevos problemas y conjuntos de datos mediante técnicas de programación especializadas.
Contenidos
Tema 1. Introducción a minería de datos
– Definición de minería de datos.
– Historia y evolución de la minería de datos.
– Aplicaciones de la minería de datos.
– Etapas del proceso de minería de datos.
Tema 2. Herramientas matemáticas y estadísticas de minería de datos
– Conceptos estadísticos básicos para minería de datos.
– Álgebra lineal y su aplicación en minería de datos.
– Probabilidad y distribuciones relevantes.
– Métodos de muestreo y remuestreo.
Tema 3. Procesamiento de datos
– Adquisición y preprocesamiento de datos.
– Limpieza y transformación de datos.
– Reducción de dimensionalidad.
– Selección de características.
Tema 4. Análisis y visualización
– Técnicas de visualización de datos
– Análisis exploratorio de datos (EDA)
– Métricas y evaluación de modelos en minería de datos
– Interpretación de resultados
Metodología de Aprendizaje
La educación actual suele limitar a estudiantes, forzándoles a absorber contenidos en lugar de fomentar la solución colectiva de problemas. En CENFOTEC, buscamos modificar este enfoque mediante nuestra metodología de aprendizaje constructivista llamada 40-40-20.
La técnica 40-40-20 divide el tiempo de clase: 40% el profesor da un charla para inducir al pensamiento autónomo basado en conceptos clave; el siguiente 40% para resolver retos individuales o en grupo, que exigen exploración, donde el docente es un facilitador; y el 20% restante para una discusión guiada por el profesorado. Para mantener la atención, consideramos 1 hora lectiva como 50 minutos, especialmente en cursos de 3-4 horas.
Adicionalmente el estudiante deberá dedicar una cantidad de horas adicionales para completar retos extraclase que el profesor le asigne.
Información adicional
Fecha de inicio | Lunes 20 de enero 2025. |
---|---|
Horario | Lunes- 18:00 a 22:00. |
Profesor | Jorge Arturo Garnier Rovira. |
Área de formación | Sistemas Inteligentes. |
Modalidad | Virtual en vivo. |
Duración | 16 horas. |
Nivel de complejidad | Intermedio. |
Perfil de ingreso | – Bachillerato en Educación Media y edad de 18 años cumplidos en adelante. |
Perfil de salida | Analista de datos, Científico de datos. |
Cursos relacionados