Statistical Thinking Background

Pensamiento estadístico para la resolución de problemas industriales

Curso gratuito de estadística en línea

Modelado predictivo y minería de texto

El análisis predictivo consiste en utilizar datos y algoritmos estadísticos para predecir lo que podría suceder a continuación en función del proceso y el entorno actual.

En este módulo, aprenderá sobre algunas de las técnicas principales que se utilizan para crear modelos predictivos, como abordar el sobreajuste, seleccionar el mejor modelo predictivo y utilizar la regresión lineal múltiple y la regresión logística. También verá cómo ajustar otros tipos de modelos predictivos, como la regresión penalizada, los árboles de decisión y las redes neuronales. Por último, aprenderá a extraer información y significado de datos de texto no estructurados, como los datos de respuestas de encuestas.

Tiempo estimado para completar este módulo: 3 a 4 horas

Los temas específicos que se tratan en este módulo incluyen:

Conceptos básicos del modelado predictivo

  • Introducción al modelado predictivo
  • Sobreajuste y validación de modelos
  • Evaluación del rendimiento del modelo: modelos de predicción
  • Evaluación del rendimiento del modelo: modelos de clasificación
  • Curvas ROC (Receiver-Operating Characteristic)

Árboles de decisión

  • Introducción a los árboles de decisión
  • Árboles de clasificación
  • Árboles de regresión
  • Árboles de decisión con validación
  • Bosques Bootstrap

Redes neuronales

  • ¿Qué es una red neuronal?
  • Interpretación de redes neuronales
  • Modelado predictivo con redes neuronales

Regresión generalizada

  • Introducción a la regresión generalizada
  • Ajuste de modelos mediante máxima verosimilitud
  • Introducción a la regresión penalizada

Comparación y selección de modelos

  • Comparar modelos predictivos

Introducción a la minería de texto

  • Introducción a la minería de texto
  • Procesamiento de datos de texto
  • Curado de la lista de términos
  • Visualización y exploración de datos de texto
  • Análisis (minería) de datos de texto