Diagrama de barras
¿Qué es un diagrama de barras?
Un diagrama de barras refleja los conteos de valores de los niveles de una variable categórica o nominal.
¿Cómo se usan los diagramas de barras?
Los diagramas de barras ayudan a entender los niveles de su variable y se pueden usar para detectar errores.
¿En qué cuestiones conviene fijarse?
Los diagramas de barras se usan en datos nominales o categóricos. Para datos continuos, mejor utilice histogramas.
Los diagramas de barras reflejan los conteos de frecuencia de los datos
Los diagramas de barras reflejan los conteos de frecuencia de valores de los distintos niveles de una variable categórica o nominal. A veces se usan diagramas de barras para representar otras estadísticas, como porcentajes. La figura 1 es un ejemplo de diagrama de barras con las respuestas a la pregunta de una encuesta.
Las barras representan los niveles de la variable; la altura de las mismas indica el conteo de respuestas de cada nivel.
¿En qué se diferencian los diagramas de barras y los histogramas?
Las dos diferencias fundamentales entre un histograma y un diagrama de barras son los espacios entre barras y los tipos de datos. Los histogramas no tienen espacio entre barras, los diagrama de barras sí tienen. Sin embargo, con muchas herramientas de software puede editar un diagrama de barras para que no tenga espacios entre barras, lo que nos lleva a la segunda diferencia clave entre histogramas y diagramas de barras.
Los histogramas se usan en datos continuos; los diagramas de barras se usan en datos categóricos o nominales. Consulte la sección «Diagramas de barras y tipos de datos» a continuación para más detalles.
¿En qué se diferencian los diagramas de Pareto y de barras?
Un diagrama de Pareto es un ejemplo especial de diagrama de barras. En los diagramas de Pareto las barras se ordenan de mayor a menor. Estos diagramas se suelen usar en control de calidad para identificar las áreas con más problemas.
Como los histogramas, los diagramas de Pareto no tienen espacios entre barras. A diferencia de los histogramas, los diagramas de Pareto resumen el conteo de variables categóricas o nominales.
La figura 2 ofrece un ejemplo de diagrama de Pareto que resume los tipos de hallazgo en una auditoría de procesos de negocio. Incluye una leyenda de las categorías, lo que permite etiquetas más largas para que las categorías sean más fáciles de leer.
Representar más estadísticas que los conteos
Aunque todos los ejemplos muestran diagramas de barras con conteos, estos pueden mostrar otras estadísticas, como porcentajes. La mayoría de herramientas de software ofrecen opciones según la estadística que se quiera representar.
Ejemplos de diagrama de barras
A menudo se usan programas para crear diagramas de barras. Estos programas permiten crear diagramas verticales u horizontales a sus usuarios, además de añadirles funciones personalizadas.
A continuación hay algunos ejemplos de diagramas de barras. Quizá quiera consultar a alguien experto en estadística, o alguno de los muchos libros y sitios web al respecto, para determinar qué tipo de diagrama se ajusta mejor a sus datos.
Las figuras 3-15 usan datos de 10 bolsas de caramelos. Cada bolsa tiene 100 caramelos y se ha reunido el conteo de los cinco sabores para cada una. El objetivo es que las bolsas tengan cantidades casi iguales de cada sabor, por lo que esperamos tener unos 20 caramelos de cada sabor por bolsa. Entre las 10 bolsas, esperamos tener aproximadamente 200 caramelos de cada sabor.
Nuestro primer paso es crear un diagrama de barras de los datos, como muestra la figura 3:
El software ordena las barras alfabéticamente por nombre del sabor, que puede ser la mejor manera de mostrar los resultados a su público.
Sin embargo, quizá prefiera ordenarlas de manera decreciente, como se ve en la figura 4:
Ahora se puede ver que el número total de unidades de caramelos para uva y naranja son iguales. Esto era cierto en la figura 3, pero no era tan fácil de ver.
Las barras son verticales. En el caso de etiquetas de gráfico largas, a menudo es mejor un diagrama de barras horizontales. En la figura 5 se muestran los mismos datos con etiquetas más largas en un gráfico horizontal. Si hubiésemos usado un diagrama de barras vertical, las etiquetas habrían sido más difíciles de leer.
Hemos usado el mismo color para todas las barras de estos ejemplos. Como norma general, usar muchos colores distintos en una gráfica la hace más difícil de entender.
Pero supongamos que la empresa de caramelos necesita que cada bolsa tenga al menos 18 caramelos de cada sabor. Entre las 10 bolsas, necesitamos por lo menos 180 caramelos de cada uno. Ya que nuestros datos reflejan solo 120 caramelos de cereza, queremos resaltar este problema. La figura 6 lo hace mediante una barra sombreada. Otras opciones serían usar un color distinto para resaltar la barra de cereza.
Puede ser conveniente agregar etiquetas a las barras. En la figura 7 se muestran los conteos al final de cada barra. Este enfoque ayuda a mostrar que podemos tener un problema con los dulces rojos de sabor manzana, ya que apenas satisface nuestro requisito de 18 unidades por bolsa.
Cómo afectan los valores extremos a los diagramas de barras
Los diagramas de barras representan conteos de las categorías de sus datos. A diferencia de los histogramas, a los diagramas de barras no les afectan los valores extremos. En un diagrama de barras sencillamente habría otra barra de categoría con muchos (o muy pocos) valores. La figura 8 muestra un conjunto de datos de caramelos distinto, que sustituye el sabor a uva con el de mango. El conteo para el mango es mucho menor del esperado.
En la Figura 9 se muestra otro ejemplo, en el que se ha sustituido Uva por Piña. El conteo de Piña es mucho mayor de lo esperado.
Los diagramas de barras pueden ayudar a identificar valores incorrectos en sus datos. En la figura 10, “Mango” se ha escrito incorrectamente “Mangi” para uno de los valores de datos, un error claro que debe corregirse. Puede ser útil comprobar sus propios datos en busca de errores con los diagramas de barras.
¿Cómo puedo agregar grupos a los diagramas de barras?
Si hay grupos en sus datos, representar todos los datos juntos en un diagrama de barras puede ayudar a revelar patrones en estos grupos. En la figura 11 se combinan los datos de tres fábricas de caramelos.
A partir de esta figura se puede ver qué fábricas usan qué sabores en sus bolsas de caramelos. También se pueden identificar problemas, como que la fábrica A pone muy pocos caramelos de mango en sus bolsas. En este ejemplo tiene sentido ordenar las barras alfabéticamente. No podemos ordenar por cantidad porque habría un orden distinto en cada fábrica.
En este ejemplo, usar colores diferentes para las distintas fábricas puede ser útil. La figura 12 muestra cada fábrica con un color distinto.
Puede ser conveniente mostrar los conteos en el eje horizontal para compararlos visualmente de manera más fácil, como se muestra en la figura 13.
Aunque la figura 13 facilita el comparar conteos de los distintos sabores, hace más difícil determinar qué sabores se usan en las distintas fábricas respecto a la figura 12.
Estas son solo algunas de las muchas maneras en las que se pueden agregar grupos a un diagrama de barras. Con sus datos, tendrá que pensar en el mensaje para dar a su público y cómo diseñar el mejor gráfico que lo transmita.
Diagramas de barras apiladas
En lugar de usar grupos, quizá prefiera usar un diagrama de barras apiladas. En un diagrama de barras apiladas, representa las respuestas de sus grupos, como las fábricas de los datos sobre caramelos. Cada grupo tiene una barra. Los conteos de frecuencia de su variable se apilan en la barra de cada fábrica. En los datos sobre caramelos, los conteos de cada sabor se apilan en la barra de cada fábrica. La figura 14 muestra un diagrama de barras apiladas con los datos sobre caramelos de las tres fábricas, dando un color distinto a cada sabor.
En la figura 14 podemos ver claramente que sólo la fábrica A utiliza mango, solo la B utiliza piña y solo la C utiliza uva. Si comparamos el tamaño de las secciones apiladas de las barras, podemos ver también que la fábrica A utiliza muy pocos caramelos de mango, y que la B utiliza muchos caramelos de piña.
Incluir una leyenda en un diagrama de barras apiladas es importante. Muchas herramientas de software permiten agregar etiquetas a un diagrama de barras apiladas, como se muestra en la figura 15. Por ejemplo, las etiquetas nos ayudan a ver que la fábrica B tenía el mismo conteo total para los sabores de cereza y naranja.
Puede resultarle útil imprimir un diagrama de barras apiladas en escala de grises antes de tomar decisiones definitivas en colores. Asimismo, como se muestra en la figura 15, al agregar etiquetas, debe asegurarse de que las etiquetas se puedan leer con el color de fondo de cada elemento del diagrama.
Diagrama de barras y tipos de datos
En las figuras 16-20 se muestra cuándo es razonable utilizar diagramas de barras o histogramas para diferentes tipos de datos.
Datos categóricos o nominales: apropiados para diagramas de barras
Los diagramas de barras tienen sentido para datos nominales o categóricos, puesto que se miden en una escala con valores posibles específicos.
En datos categóricos, la muestra suele dividirse en grupos, y las respuestas tienen un orden definido. Por ejemplo, en una encuesta en la que se le pide su opinión en una escala de «muy en desacuerdo» a «muy de acuerdo» sus respuestas serán categóricas.
Con los datos nominales, la muestra también se divide en grupos, pero sin un orden particular. Un ejemplo de variable nominal sería el país de residencia. Puede usar una abreviatura del país, o códigos numéricos para asociarlos al nombre. De un modo u otro, solo le está poniendo nombre a los distintos grupos de datos.
Datos continuos: utilice histogramas
Los diagramas de barras tienen sentido para datos continuos, ya que se miden sobre una escala con muchos valores posibles. Algunos ejemplos de datos continuos son:
- Edad
- Presión sanguínea
- Peso
- Temperatura
- Velocidad
Para todos estos ejemplos, utilice histogramas en lugar de diagramas de barras.