Diagramme en barres
Qu'est-ce qu'un diagramme en barres ?
Un diagramme en barres montre les dénombrements de valeurs pour les niveaux d'une variable catégorielle ou nominale.
Comment les diagramme en barres sont-ils utilisés ?
Les diagrammes en barres vous aident à comprendre les niveaux de votre variable et peuvent être utilisés pour vérifier les erreurs.
Quels sont les problèmes à prendre en compte ?
Les diagrammes en barres sont utilisés pour des données nominales ou catégorielles. Pour les données continues, utilisez plutôt un histogramme.
Les diagrammes en barres montrent les dénombrements de fréquence des données
Les diagrammes en barres montrent les dénombrements de fréquence des valeurs pour les différents niveaux d'une variable catégorielle ou nominale. Parfois, les diagrammes en barres affichent également d'autres statistiques, comme des pourcentages. La Figure 1 est un exemple de diagramme en barres sur les réponses à une enquête.
Les barres montrent les niveaux de la variable ; la hauteur des barres montre les dénombrements de réponses pour ce niveau.
Quelle est la différence entre les diagrammes en barres et les histogrammes ?
Les deux différences principales entre les histogrammes et les diagrammes en barres sont les écarts entre les barres et les types de données. Les histogrammes n'ont pas d'écart entre les barres, contrairement aux diagrammes en barres. Cependant, de nombreux outils logiciels vous permettent de réviser un diagramme en barres de manière à ce qu'il n'y ait aucun écart entre les barres, ce qui conduit à la deuxième grande différence entre les histogrammes et les diagrammes en barres.
Les histogrammes sont utilisés pour les données continues, tandis que les diagrammes en barres sont utilisés pour les données catégorielles ou nominales. Voir la section « Diagrammes en barres et types de données » ci-dessous pour plus d'informations.
Quelle est la différence entre les diagrammes en barres et les diagrammes de Pareto ?
Un diagramme de Pareto est un cas particulier de diagramme en barres. Dans un diagramme de Pareto, les barres sont ordonnées de la plus haute à la plus basse. Ces diagrammes sont souvent utilisés pour le contrôle de qualité afin d'identifier les domaines les plus problématiques.
Comme un histogramme, le diagramme de Pareto ne présente aucun écart entre les barres. Contrairement à l'histogramme, le diagramme de Pareto résume les dénombrements pour une variable nominale ou catégorielle.
La Figure 2 donne un exemple de diagramme de Pareto qui résume les types de conclusions dans un audit de procédures opérationnelles. Le diagramme contient une légende pour les catégories, ce qui permet d'avoir des étiquettes plus longues pour une meilleure lisibilité des catégories.
Représenter des statistiques autres que les dénombrements
Alors que tous les exemples montrent des diagrammes en barres avec des dénombrements, ces graphiques peuvent également représenter d'autres statistiques, comme des pourcentages. La plupart des outils logiciels offrent plusieurs options pour les statistiques à représenter.
Exemples de diagrammes en barres
Les diagrammes en barres sont souvent créés à l'aide d'un logiciel. Le logiciel permet aux utilisateurs de créer des diagrammes en barres verticaux ou horizontaux, mais également de personnaliser le diagramme en barres.
Veuillez trouver ci-dessous quelques exemples de diagrammes en barres. Nous vous recommandons de consulter un statisticien ou les nombreux livres et sites Web disponibles afin de déterminer quel type de diagramme en barres convient le mieux pour vos données.
Les Figures 3-15 utilisent les données de 10 sacs de bonbons. Chaque sac contient 100 bonbons et le dénombrement des cinq saveurs a été relevé pour chaque sac. L'objectif est que chaque sac contienne un nombre presque égal de bonbons de chaque saveur : On s'attend donc à obtenir 20 pièces de bonbons de chacune des saveurs dans chaque sac. Dans les 10 sacs, on s'attend à obtenir approximativement 200 pièces de bonbons pour chaque saveur.
Notre première étape consiste à créer un diagramme en barres des données, comme le montre la Figure 3 :
Le logiciel classe les barres dans l'ordre alphabétique des noms des saveurs, ce qui pourrait être la meilleure façon de présenter les résultats à votre public.
Cependant, vous pourriez également trier les barres par dénombrements décroissants, comme dans la Figure 4 :
Nous observons maintenant que les dénombrements totaux de pièces de bonbons pour les saveurs Raisin et Orange sont les mêmes. Ceci était vrai dans la Figure 3 mais n'était pas facile à observer.
Les barres sont verticales. Pour des étiquettes de graphiques étendues , un diagramme en barres horizontales est souvent préférable. La Figure 5 montre les mêmes données avec des étiquettes plus longues pour les saveurs dans le diagramme horizontal. Si nous avions utilisé un diagramme en barres verticales, les étiquettes auraient été plus difficiles à lire.
Nous avons utilisé la même couleur pour l'ensemble des barres dans ces exemples. En règle générale, l'utilisation de nombreuses couleurs rend le graphique plus difficile à comprendre.
Mais supposons que le fabricant de bonbons exige que chaque sac soit rempli d'au moins 18 pièces de chaque saveur. Sur les 10 sacs, nous avons besoin d'au moins 180 pièces pour chaque saveur. Comme nos données montrent seulement 120 pièces pour la saveur Cerise, nous souhaitons mettre en évidence ce problème. Pour ce faire, la Figure 6 utilise une barre ombrée. D'autres options consistent à utiliser une couleur différente pour mettre en évidence la barre Cerise.
Vous voudrez peut-être ajouter des étiquettes aux barres. La Figure 7 affiche les dénombrements à la fin de chaque barre. Cette approche permet de montrer que nous pourrions également avoir un problème avec la saveur Pomme d'amour, puisqu'il répond à peine à notre exigence de 18 bonbons par sachet.
Comment les valeurs de données extrêmes affectent les diagrammes en barres ?
Les diagrammes en barres montrent les dénombrements de catégories dans vos données. Contrairement aux histogrammes, les diagrammes en barres ne sont pas affectés par des valeurs extrêmes. Le diagramme en barres montre simplement une autre barre pour la catégorie avec très peu (ou beaucoup) de valeurs dans la barre. La Figure 8 montre un jeu différent de données de bonbons dans lequel la saveur Raisin est remplacée par Mangue. Le dénombrement de la saveur Mangue est bien inférieur aux attentes.
La Figure 9 montre un autre exemple, où le goût Raisin est remplacé par Ananas. Le dénombrement pour le goût Ananas est beaucoup plus élevé qu'attendu.
Les diagrammes en barres peuvent aider à identifier les valeurs incorrectes dans vos données. Dans la figure 10, « Mangue » est incorrectement orthographié « Mangu » dans l'une des valeurs, ce qui est une erreur qui doit être corrigée. Il peut être utile de vérifier si vos données contiennent des erreurs à l'aide de diagrammes en barres.
Comment puis-je ajouter des groupes au diagramme en barres ?
S'il y a des groupes dans vos données, la représentation graphique de l'ensemble des données dans un diagramme en barres peut aider à mettre en évidence des structures dans tous les groupes. La Figure 11 combine des données issues de trois usines de bonbons.
Sur cette figure, vous pouvez voir quelles usines utilisent quels parfums dans les sachets de bonbons. Vous pouvez également y observer les problèmes, comme le fait que l'usine A met trop peu de bonbons au goût Mangue dans les sachets. Dans cet exemple, il est logique de classer les barres par ordre alphabétique. Nous ne pouvons pas trier par dénombrement, car l'ordre serait différent selon les usines.
Dans cet exemple, il peut être utile d'utiliser des couleurs spécifiques pour les différentes usines. La Figure 12 représente chaque usine par une couleur différente.
Vous voudrez peut-être afficher les dénombrements sur l'axe horizontal pour faciliter les comparaisons visuelles des dénombrements, comme le montre la Figure 13.
Même si la Figure 13 facilite la comparaison des dénombrements pour les différentes saveurs, il s'avère plus difficile de déterminer quelles saveurs sont utilisées dans les différentes usines que dans la Figure 12.
Voici quelques-unes des différentes méthodes pour ajouter des groupes dans les diagrammes en barres. Pour vos données, vous devez réfléchir au message que vous souhaitez transmettre à votre public, et comment créer le graphique le mieux adapté à ce message.
Diagrammes en barres empilées
Plutôt que d'utiliser des groupes, vous pourriez vouloir utiliser un diagramme en barres empilées. Ainsi, vous montrez les réponses correspondant à vos groupes, c'est-à-dire les usines des données de Bonbons. Chaque groupe a une barre. Les dénombrements de fréquences sur votre variable sont ensuite empilés dans la barre pour chaque usine. Pour les données de Bonbons, les dénombrements de saveurs seront empilés avec la barre pour chaque usine. La Figure 14 montre un diagramme en barres empilées pour les données des Bonbons des trois usines, en utilisant une couleur différente pour chaque saveur.
Dans la Figure 14, nous voyons aisément que seule l'Usine A utilise de la Mangue tandis que seule l'Usine B utilise de l'Ananas, et que seule l'Usine C utilise du Raisin. En comparant les tailles des sections empilées des barres, nous observons également que l'Usine A utilise très peu de bonbons Mangue, et que l'Usine B utilise beaucoup de bonbons Ananas.
Il est important d'ajouter une légende dans les diagrammes en barres empilées. De nombreux outils logiciels vous permettent d'ajouter des étiquettes à un diagramme en barres empilées comme le montre la Figure 15. Par exemple, les étiquettes nous permettent d'observer que l'Usine B dispose du même dénombrement total pour les saveurs Cerise et Orange.
Il peut s'avérer utile d'imprimer un diagramme en barres empilées en niveaux de gris avant de prendre la décision finale concernant les couleurs. Par ailleurs, comme le montre la Figure 15, lorsque vous ajoutez des étiquettes, vous devez vous assurer que l'étiquette puisse être lue contre la couleur de fond pour chaque élément de la barre empilée.
Diagramme en barres et types de données
Les Figures 16 à 20 montrent les situations dans lesquelles il convient d'utiliser des diagrammes en barres ou des histogrammes pour différents types de données.
Données catégorielles ou nominales : conviennent aux diagrammes en barres
Les diagrammes en barres conviennent pour les données catégorielles ou nominales puisque celles-ci sont mesurées sur une échelle avec des valeurs possibles spécifiques.
Avec des données catégorielles, l'échantillon est souvent divisé en groupes et les réponses ont un ordre défini. Par exemple, dans une enquête où il vous est demandé de donner votre opinion sur une échelle allant de « Pas du tout d'accord » à « Tout à fait d'accord », vos réponses sont catégorielles.
Avec les données nominales, l'échantillon est également divisé en groupes mais sans ordre particulier. Le pays de résidence est un exemple de variable nominale. Vous pouvez utiliser l'abréviation du pays ou vous pouvez utiliser des nombres afin de coder le nom du pays. Dans tous les cas, vous nommez tout simplement les différents groupes de données.
Données continues : utilisez des histogrammes
Les diagrammes en barres ne conviennent pas aux données continues puisque ces dernières sont mesurées sur une échelle avec de nombreuses valeurs possibles. Voici quelques exemples de données continues :
- Âge
- Pression artérielle
- Pondération
- Température
- Vitesse
Pour tous ces exemples, utilisez des histogrammes plutôt que des diagrammes en barres.