Tipos de gráficos
A continuación se muestra una lista de varios tipos de gráficos que se pueden utilizar en análisis exploratorio de datos (EDA). Haga clic en cada uno de ellos para ver un ejemplo de ese tipo de gráfico, el número de variables que utiliza y una descripción de su finalidad.
Histogramas
- Número de variables: 1.
- Muestra la forma o la distribución de los datos; puede ayudar a identificar valores atípicos.
- Más información sobre histogramas.
Histogramas colocados en paralelo
- Número de variables: 2
- Muestra las formas o las distribuciones de grupos de datos; puede ayudar a identificar valores atípicos.
Diagramas de barras
- Número de variables: 1.
- Muestra el conteo de frecuenciade valores para una variable categórica; puede ser vertical (como se muestra a continuación, en la figura 3) u horizontal.
- Más información sobre el diagramas de barras.
Diagramas de barras con datos agrupados
- Número de variables: 2 o más, según cuántas variables se usen para definir los grupos.
- Muestra diagramas de barras para grupos definidos por otra variable. Los diagramas de barras agrupadas tienen un gráfico separado para cada nivel de la variable de agrupación.
Diagramas de barras apiladas
- Número de variables: 2 o más, según cuántas variables se usen para definir los grupos.
- Muestra diagramas de barras para grupos definidos por otra variable. Los diagramas de barras apiladas tienen una barra por cada nivel de la variable de agrupación. Los colores o patrones para conteos de otra variable están apilados en cada barra.
Diagramas de Pareto
- Número de variables: 1.
- Muestra conteos de frecuencia ordenados para una variable. Útil para resaltar el "puñado esencial". El diagrama de Pareto, es un tipo de diagrama de barras que suele incluir una curva de porcentaje acumulado.
- Más información sobre el diagrama de Pareto.
Diagramas de barras empaquetadas
- Número de variables: 1.
- Muestra conteos de frecuencia ordenados para una variable. Se usa en lugar del diagrama de Pareto, en especial si hay muchas categorías. Útil para resaltar el "puñado esencial".
- Más información sobre el diagramas de barras empaquetadas.
Gráficos en mosaico
- Número de variables: 2 o más.
- Muestra la posible relación entre variables categóricas. Útiles para localizar errores de datos, como categorías mal escritas. Un tipo especial de gráfico de barras apilado que muestra más de una variable en el eje X.
- Más información sobre gráficos en mosaico.
Diagramas en árbol
- Número de variables: 2 o más.
- Muestra la posible relación entre variables. Un tipo especial de gráfico de barras apilado que se colorea, ordena y dimensiona según distintas variables.
- Más información sobre diagramas en árbol.
Diagramas de caja
- Número de variables: 1.
- Muestra la distribución de los datos. Partes de la caja identifican el percentil 25, la mediana (percentil 50) y el percentil 75. En función de los datos, los bigotes muestran el mínimo y el máximo; los valores atípicos llegan más allá de estos. Se usan para localizar errores de datos y explorar una variable.
- Más información sobre diagramas de caja.
Diagramas de caja colocados en paralelo
- Número de variables: 2 o más, según cuántas variables se usen para definir los grupos.
- Muestra diagramas de caja para grupos definidos por otra variable. Se usan para localizar errores de datos y explorar dos o más variables.
Gráficos de cuantiles normales
- Número de variables: 1.
- Determina si la hipótesis de que una variable tiene una distribución normal es razonable.
Gráficos de líneas
- Número de variables: 2
- Muestra cambios a lo largo del tiempo. El eje X debe contener valores ordenados por tiempo. Los gráficos lineales, también llamados diagramas de líneas o gráficos de ejecución, son útiles para localizar valores atípicos.
- Más información sobre gráficos lineales.
Gráficos de líneas con categorías
- Número de variables: 2 o más, según cuántas variables se usen para definir los grupos.
- Muestra varios diagramas de barras para grupos definidos por otra variable. Se usan para entender los cambios a lo largo del tiempo para múltiples variables y para hallar valores atípicos.
Gráficos de dispersión
- Número de variables: 2 o más, según cuantas variables se usen para definir los grupos por colores y marcadores.
- Muestra la posible relación entre dos variables e identifica valores atípicos. Agregar colores y/o marcadores de otras variables puede ayudar con el análisis exploratorio (EDA). Agregar líneas de referencia o límites de especificación puede ayudar a identificar valores atípicos.
- Más información sobre diagramas de dispersión.
Matriz de gráficos de dispersión
- Número de variables: varias.
- Muestra posibles relaciones entre múltiples variables, examinando todas las combinaciones de dos. Se pueden agregar gráficos adicionales: histogramas para cada variable a fin de identificar valores atípicos, elipses de densidad para cada gráfico de dispersión a fin de identificar valores atípicos multidimensionales, mapas de calor de correlaciones para aclarar posibles relaciones.
Gráficos circulares
- Número de variables: 1 o más.
- Muestra relaciones de variables con el total. Añadir categorías en varios gráficos circulares es más útil que un solo gráfico circular. Para una sola variable, un diagrama de barras hace que las diferencias de valor pequeñas sean más fáciles de distinguir.
- Más información sobre gráficos circulares.
Mapas de calor
- Número de variables: 2 o más.
- Muestra la posible relación entre variables. Se suele usar para datos que cambian con el tiempo. Usa colores para explorar la relación entre variables.
- Más información sobre mapas de calor.
Diagramas de tallo y hojas
- Número de variables: 1.
- Muestra la forma de los datos e identifica valores atípicos. Ya empleados de forma generalizada antes de la implantación de los ordenadores; los histogramas se usan a menudo hoy en día.