Resumen del módulo Análisis exploratorio de datos (0:47)
Pensamiento estadístico para la resolución de problemas industriales
Curso gratuito de estadística en línea
Análisis exploratorio de datos
El análisis exploratorio de datos (EDA, por sus siglas en inglés) es un proceso de investigación en el que se usan estadísticas de resumen y herramientas gráficas para llegar a conocer los datos y comprender lo que se puede averiguar de ellos.
Con EDA, puede descubrir patrones en sus datos, comprender las posibles relaciones entre variables y hallar anomalías, como valores atípicos u observaciones inusuales. El objetivo es generar preguntas o hipótesis interesantes que se pueden comprobar mediante métodos estadísticos más formales.
Tiempo estimado para completar este módulo: 6 o 7 horas
Los temas específicos que se cubren en este módulo son:
Descripción de los datos
- Introducción a la estadística descriptiva
- Tipos de datos
- Histogramas
- Medidas de ubicación y tendencia central
- Medidas de dispersión: rango y rango intercuartílico
- Medidas de dispersión: varianza y desviación estándar
- Visualización de datos continuos
- Descripción de los datos categóricos
Conceptos de probabilidad
- Introducción a los conceptos de probabilidad
- Muestras y poblaciones
- Descripción de la distribución normal
- Comprobación de la normalidad
- Teorema del límite central
Análisis exploratorio de datos para la resolución de problemas
- Introducción al análisis exploratorio de datos
- Exploración de datos continuos: herramientas mejoradas
- Gráficos de Pareto
- Diagramas de barras empaquetadas y filtrado de datos
- Mapas en árbol y gráficos en mosaico
- Uso de diagramas de Trellis y variables superpuestas
- Gráficos de burbujas y mapas de calor
- Resumen de las herramientas de análisis exploratorio de datos
Comunicación mediante datos
- Introducción a la comunicación mediante datos
- Creación de visualizaciones eficaces
- Evaluación de la eficacia de una visualización
- Diseño de una visualización eficaz
- Comunicación visual con animaciones
- Diseño específico para su público
- Comprensión de su público objetivo
- Diseño de visualizaciones para la comunicación
- Diseño de visualizaciones: qué se debe y no se debe hacer
Cómo guardar y compartir resultados
- Introducción a cómo guardar y compartir resultados
- Cómo guardar y compartir resultados en JMP
- Cómo guardar y compartir resultados fuera de JMP
- Elección del formato a usar
Preparación de datos para su análisis
- Aspectos básicos de las tablas de datos
- Problemas comunes de la calidad de los datos
- Identificación de problemas en la tabla de datos
- Identificación de problemas en las variables de una en una
- Reestructuración de los datos para su análisis
- Combinación de datos
- Derivación de nuevas variables
- Uso de fechas