Analyser ses données > Analyser les distributions > Distributions de variables continues
Date de parution : 09/30/2021

Distributions de variables continues

L'analyse d'une variable continue peut avoir pour objectif de répondre aux questions suivantes :

La forme des données correspond-t-elle à une distribution connue ?

Les données contiennent-elles des valeurs aberrantes ?

Quelle est la moyenne des données ?

La moyenne est-elle statistiquement différente d’une valeur cible ou historique ?

Comment les données sont-elles dispersées ? En d’autres termes, quel est l’écart-type ?

Quelles sont les valeurs minimales et maximales ?

Des graphiques, des statistiques de résumé et des tests statistiques simples peuvent vous permettre de répondre à ces questions — ainsi qu'à d'autres interrogations.

Scénario

Cet exemple s'appuie sur la table de données Car Physical Data.jmp, qui contient des informations sur 116 modèles de voiture.

Un spécialiste de la planification a été sollicité par une société ferroviaire pour identifier les problèmes qui pourraient découler du transport des voitures en train. À l’aide des données, le spécialiste de la planification souhaite étudier les questions suivantes :

Quel est le poids moyen des voitures ?

Comment le poids des voitures est-il dispersé (écart-type) ?

Quels sont les poids minimal et maximal des voitures ?

Les données contiennent-elles des valeurs aberrantes ?

Représentez le poids des voitures dans un histogramme pour répondre à ces questions.

Créer l'histogramme

1. Choisissez Aide > Bibliothèque d'échantillons de données et ouvrez le fichier Car Physical Data.jmp.

2. Choisissez Analyse > Distribution.

3. Sélectionnez Weight et cliquez sur Y, Colonnes.

4. Cliquez sur OK.

5. Pour faire pivoter la fenêtre de rapport, cliquez sur le triangle rouge Weight et sélectionnez Options d'affichage > Mise en page horizontale.

Figure 5.7 Distribution de Weight 

Distribution de Weight

La fenêtre de rapport contient trois sections :

Un histogramme et une boîte à moustaches.

Un rapport Quantiles qui fournit les centiles de la distribution.

Un rapport Statistiques de résumé qui affiche la moyenne, l’écart-type et d’autres statistiques.

Interpréter les résultats de la distribution

Grâce aux renseignements fournis par la Figure 5.7, le spécialiste de la planification dispose à présent d'éléments de réponse.

Quel est le poids moyen des voitures ?

L'histogramme montre un poids d'environ 3 000 livres.

Comment le poids est-il dispersé (écart-type) ?

Les statistiques de résumé montrent un poids d'environ 2.958 livres. Les statistiques de résumé montrent un écart-type d'environ 536 livres.

Quels sont les poids minimal et maximal ?

L'histogramme montre un minimum d'environ 1 500 livres et un maximum d'environ 4 500 livres. Les quantiles montrent un minimum d'environ 1 695 livres et un maximum d'environ 4 285 livres.

Existe-t-il des valeurs aberrantes ?

Non.

La fenêtre de rapport par défaut présentée dans la Figure 5.7 affiche un jeu de graphiques et de statistiques minimum. D’autres graphiques et statistiques sont disponibles via le menu du triangle rouge.

Tirer les conclusions

En se basant sur d’autres recherches, la société ferroviaire a établi qu'un poids moyen de 3000 livres constituait le poids le plus rentable à transporter. Le spécialiste de la planification doit maintenant déterminer si, au sein de la population générale des voitures susceptibles d’être transportées, le poids moyen est de 3000 livres. En vous basant sur cet échantillon de la population, utilisez un test de Student (également appelé test t) pour tirer des conclusions sur la population générale.

Tester les conclusions

1. Cliquez sur le triangle rouge Weight et sélectionnez Comparaison de la moyenne à une référence.

2. Dans la fenêtre qui apparaît, saisissez 3000 dans le champ Spécifier la moyenne de référence.

3. Cliquez sur OK.

Figure 5.8 Résultats du test de la moyenne 

Résultats du test de la moyenne

Interpréter le test de Student

Le résultat principal d'un test de Student est la p-value. Dans cet exemple, elle est de 0,396 et l’analyste utilise un niveau de significativité de 0,05. Puisque 0,396 est supérieur à 0,05, vous ne pouvez pas conclure que le poids moyen des modèles de voiture au sein de la population générale est très différent de 3000 livres. Si la p-value avait été inférieure au niveau de significativité, le spécialiste de la planification en aurait conclu que le poids moyen des voitures au sein de la population générale était significativement différent de 3 000 livres.

Vous voulez plus d'informations ? Avoir des questions? Obtenez des réponses dans la communauté d'utilisateurs JMP (community.jmp.com).