Types de graphiques

Vous trouverez ci-dessous une liste de plusieurs types de graphiques pouvant être utilisés dans le cadre d'une analyse exploratoire des données . Cliquez sur chacun des types de graphiques pour en voir un exemple, le nombre de variables qu'ils utilisent et une description de leur objectif.

Histogrammes

  • Nombre de variables : 1.
  • Affiche la forme ou la distribution des données ; peut aider à identifier les valeurs aberrantes.
  • En apprendre plus au sujet des histogrammes.
Figure 1 : Histogramme

Histogrammes alignés côte à côte

  • Nombre de variables : 2.
  • Affiche les formes ou les distributions pour les groupes de données ; permet d'identifier les valeurs aberrantes.
Figure 2 : Histogrammes alignés côte à côte avec deux variables

Diagrammes en barres

  • Nombre de variables : 1.
  • Affiche le dénombrement de fréquence des valeurs pour une variable catégorielle ; peut être vertical (comme ci-dessous dans la Figure 3) ou horizontal.
  • Vous pouvez obtenir plus d'informations sur les diagrammes en barres en cliquant ici.
Figure 3 : Diagramme en barres affichant un dénombrement

Diagrammes en barres groupées

  • Nombre de variables : 2 ou plus, en fonction du nombre de variables qui sont utilisées pour définir les groupes.
  • Affiche les diagrammes en barres pour des groupes définis par une autre variable. Les diagrammes en barres groupées ont un diagramme séparé à chaque niveau de la variable de regroupement.
Figure 4 : Diagrammes en barres groupées

Diagrammes en barres empilées

  • Nombre de variables : 2 ou plus, en fonction du nombre de variables qui sont utilisées pour définir les groupes.
  • Affiche les diagrammes en barre pour des groupes définis par une autre variable. Dans les diagrammes en barres empilées, une barre représente chaque niveau de la variable de groupement. Les couleurs ou les configurations des dénombrements d'une autre variable sont empilées dans chaque barre.
Figure 5 : Diagramme en barres empilées affichant une seule barre pour chaque niveau de la variable de groupement

Diagrammes de Pareto

  • Nombre de variables : 1.
  • Affiche les dénombrements de fréquence classés pour une variable. Utile pour mettre en évidence les rares facteurs fondamentaux. Les diagrammes de Pareto, un type de diagramme en barres, comportent souvent une courbe de pourcentages cumulés.
  • Vous pouvez obtenir plus d'informations sur les diagrammes de Pareto en cliquant ici.
Figure 6 : Diagramme de Pareto montrant les dénombrements de fréquence classés d'une variable

Diagrammes en barres groupés

  • Nombre de variables : 1.
  • Affiche les dénombrements classés par fréquence pour une variable. Utilisé au lieu d'un diagramme de Pareto, surtout lorsqu'il y a de nombreuses catégories. Utile pour mettre en évidence les rares catégories fondamentales.
  • En apprendre plus au sujet des diagrammes en barres groupées.
Figure 7 : Diagramme en barres groupés montrant les dénombrements classés par fréquence d'une variable dans plusieurs catégories

Graphiques en mosaïque

  • Nombre de variables : 2 ou plus.
  • Montre les relations possibles entre variables catégorielles. Utile pour trouver des erreurs de données, par exemple des fautes de saisie dans le nom des catégories. Un type particulier de diagramme en barres empilées qui montre plus d'une variable sur l'axe X.
  • En apprendre plus au sujet des graphiques en mosaïque.
Figure 8 : Graphique en mosaïque montrant les relations possibles entre des variables catégorielles

Treemaps

  • Nombre de variables : 2 ou plus.
  • Montre les relations possibles entre les variables. Un type spécial de diagramme en barres empilées qui colore, ordonne et dimensionne en fonction de différentes variables.
  • En savoir plus au sujet des treemaps.
Figure 9 : Treemap montrant les relations entre des variables

Boîtes à moustaches

  • Nombre de variables : 1.
  • Montre la distribution des données. Les parties de la boîte identifient le 25e centile, la médiane (50e centile) et le 75e centile. En fonction des données, les moustaches montrent le minimum et le maximum ; les valeurs aberrantes apparaissent au-delà des moustaches. La boite à moustache est utilisée pour trouver des erreurs dans la donnée et explorer une variable.
  • En apprendre plus au sujet des boîtes à moustaches.
Figure 10 : Boîte à moustaches

Boîtes à moustaches alignées côte à côte

  • Nombre de variables : 2 ou plus, en fonction du nombre de variables qui sont utilisées pour définir les groupes.
  • Affiche les diagrammes en barres pour des groupes définis par une autre variable. Utilisé pour trouver des erreurs de données et explorer deux variables ou plus.
Figure 11 : Boîte à moustaches côte à côte utilisée pour examiner deux variables ou plus

Graphiques des quantiles normaux

  • Nombre de variables : 1.
  • Détermine si l'hypothèse selon laquelle une variable aurait une distribution normale est raisonnable.
Figure 12 : Graphique des quantiles normaux utilisé pour déterminer si une variable a une distribution normale

Graphiques linéaires

  • Nombre de variables : 2.
  • Montre les changements dans le temps. Les valeurs de l'axe X doivent être ordonnées de manière chronologique. Les graphiques linéaires, également appelés diagrammes de courbes ou cartes de suivi, sont utiles pour trouver les valeurs aberrantes.
  • En savoir plus au sujet des graphiques linéaires.
Figure 13 : Graphique linéaire montrant l'évolution dans le temps

Graphiques linéaires avec catégories

  • Nombre de variables : 2 ou plus, en fonction du nombre de variables qui sont utilisées pour définir les groupes.
  • Affiche des graphiques linéaires multiples pour des groupes définis par une autre variable. Utilisé pour comprendre des changements dans le temps de variables multiples et pour trouver des valeurs aberrantes.
Figure 14 : Graphique linéaire avec catégories utilisé pour comprendre comment plusieurs variables évoluent dans le temps

Nuages de points

  • Nombre de variables : 2 ou plus, en fonction du nombre de variables utilisées pour définir des groupes pour les couleurs et les marqueurs.
  • Montre une relation possible entre deux variables et identifie les valeurs aberrantes. Ajouter des couleurs et/ou des marqueurs pour les autres variables peut aider à l'analyse exploratoire des données. Ajouter des lignes de référence ou des limites de spécifications peut aider à identifier les valeurs aberrantes.
  • En apprendre plus au sujet des nuages de points.
Figure 15 : Nuage de points montrant une relation possible entre deux variables

Matrice de graphiques de nuages de points

  • Nombre de variables : beaucoup.
  • Montre les relations possibles entre les variables multiples en observant toutes les combinaisons à deux facteurs. Des graphiques additionnels peuvent être ajoutés : des histogrammes pour chaque variable afin d'identifier les valeurs aberrantes, des ellipses de densité pour chaque nuage de points pour identifier les valeurs aberrantes multidimensionnelles, des cartes thermiques de corrélation pour clarifier des relations possibles.
Figure 16 : Matrice de nuage de points montrant les relations possibles entre plusieurs variables

Diagrammes en secteurs

  • Nombre de variables : 1 ou plus.
  • Affiche les relations entre parties et tout pour une variable. Ajouter des catégories pour des diagrammes en secteurs multiples s'avère plus utile qu'un diagramme en secteurs uniques. Pour une variable unique, un diagramme en barres permet de mieux distinguer les petits différences de valeurs.
  • En savoir plus au sujet des diagrammes en secteurs.
Figure 17 : Diagramme en secteurs montrant les relations entre les parties et le tout d'une variable

Cartes thermiques

  • Nombre de variables : 2 ou plus.
  • Montre les relations possibles entre les variables. Utilisé le plus souvent pour des données qui changent dans le temps. Utilise la couleur pour explorer les relations entre les variables.
  • En savoir plus au sujet des cartes thermiques.
Figure 18 : Carte thermique montrant les relations possibles entre des variables

Diagrammes en tiges et feuilles

  • Nombre de variables : 1.
  • Montre la forme des données et identifie les valeurs aberrantes. Était plus largement utilisé avant que les ordinateurs ne soient disponibles ; les histogrammes sont désormais utilisés plus souvent.
Figure 19 : Diagramme en tiges et feuilles montrant la forme des données et identifiant les valeurs aberrantes