Resumen del módulo Modelos predictivos y minería de texto (0:54)
Pensamiento estadístico para la resolución de problemas industriales
Curso gratuito de estadística en línea
Modelado predictivo y minería de texto
El análisis predictivo consiste en utilizar datos y algoritmos estadísticos para predecir lo que podría suceder a continuación en función del proceso y el entorno actual.
En este módulo, aprenderá sobre algunas de las técnicas principales que se utilizan para crear modelos predictivos, como abordar el sobreajuste, seleccionar el mejor modelo predictivo y utilizar la regresión lineal múltiple y la regresión logística. También verá cómo ajustar otros tipos de modelos predictivos, como la regresión penalizada, los árboles de decisión y las redes neuronales. Por último, aprenderá a extraer información y significado de datos de texto no estructurados, como los datos de respuestas de encuestas.
Tiempo estimado para completar este módulo: 3 a 4 horas
Los temas específicos que se tratan en este módulo incluyen:
Conceptos básicos del modelado predictivo
- Introducción al modelado predictivo
- Sobreajuste y validación de modelos
- Evaluación del rendimiento del modelo: modelos de predicción
- Evaluación del rendimiento del modelo: modelos de clasificación
- Curvas ROC (Receiver-Operating Characteristic)
Árboles de decisión
- Introducción a los árboles de decisión
- Árboles de clasificación
- Árboles de regresión
- Árboles de decisión con validación
- Bosques Bootstrap
Redes neuronales
- ¿Qué es una red neuronal?
- Interpretación de redes neuronales
- Modelado predictivo con redes neuronales
Regresión generalizada
- Introducción a la regresión generalizada
- Ajuste de modelos mediante máxima verosimilitud
- Introducción a la regresión penalizada
Comparación y selección de modelos
- Comparar modelos predictivos
Introducción a la minería de texto
- Introducción a la minería de texto
- Procesamiento de datos de texto
- Curado de la lista de términos
- Visualización y exploración de datos de texto
- Análisis (minería) de datos de texto