L’histogramme est l’un des outils graphiques les plus efficaces pour comprendre la distribution d’une variable continue. Utilisez un histogramme pour identifier, au sein de vos données :
• la valeur moyenne et la variation moyenne
• les valeurs extrêmes
Figure 4.2 Exemple d’histogramme
Pour visualiser un histogramme instantanément, cliquez sur l'icône d'histogramme dans l'en-tête de colonne. Les histogrammes apparaissent sous l'en-tête de colonne.
Figure 4.3 Histogrammes instantanés
Cet exemple s'appuie sur la table de données Companies.jmp, qui contient des données sur les bénéfices d’un groupe de sociétés.
Un analyste financier souhaite étudier les questions suivantes :
• De manière générale, à combien s’élève le bénéfice de chaque société ?
• Quel est le bénéfice moyen ?
• Des sociétés enregistrent-elles des bénéfices beaucoup plus élevés ou beaucoup plus faibles que d'autres ?
Pour répondre à ces questions, représentez les données de Profits ($M) dans un histogramme.
1. Choisissez Aide > Bibliothèque d'échantillons de données et ouvrez le fichier Companies.jmp.
2. Choisissez Analyse > Distribution.
3. Sélectionnez Profits ($M) et cliquez sur Y, Colonnes.
Figure 4.4 Fenêtre Distribution de la colonne Profits ($M)
4. Cliquez sur OK.
Figure 4.5 Histogramme de Profits ($M)
L’histogramme apporte les réponses suivantes :
• La majeure partie des bénéfices se situent entre -1 000 $ et 1 500 $.
Toutes les barres, sauf une, se situent dans cet intervalle. De plus, la majorité des bénéfices sont compris entre 0 et 500 $. La barre représentant cet intervalle est nettement plus longue que les autres.
• Le bénéfice moyen est légèrement inférieur à 500 $.
Dans la boîte à moustaches, le milieu du losange indique la valeur moyenne. Dans ce cas, la moyenne est légèrement au-dessous du repère 500 $.
• Une société affiche des bénéfices nettement supérieurs aux autres, et pourrait de ce fait représenter une valeur aberrante. Une valeur aberrante est un point de données qui se distingue nettement des autres.
Cette valeur aberrante est représentée par une barre très courte située en haut de l’histogramme. La barre est courte et représente un petit groupe (ici, une seule société).Elle se distingue largement des autres barres de l’histogramme.
En plus de l’histogramme, ce rapport inclut :
• La boîte à moustaches, qui est une autre forme de synthèse graphique des données. Pour des informations détaillées sur la boîte à moustaches, voir Essential Graphing.
• Les rapports Quantiles et Statistiques de résumé. Ces rapports sont décrits dans le paragraphe Analyser les distributions.
Dans JMP, les tables de données et les rapports sont liés entre eux. Cliquez sur une barre de l’histogramme pour sélectionner les lignes correspondantes dans la table de données.