Analyser ses données > Analyser les relations > Comparer les moyennes d'une variable
Date de parution : 08/23/2023

Comparer les moyennes d'une variable

Si vous avez une variable Y continue et une variable X catégorielle, vous pouvez comparer les moyennes des différents niveaux de la variable X.

Scénario

Cet exemple s'appuie sur la table de données Companies.jmp, qui contient des données financières sur 32 sociétés des industries pharmaceutique et informatique.

Un analyste financier souhaite étudier la question suivante :

Quels sont les bénéfices des sociétés informatiques par rapport à ceux des sociétés pharmaceutiques ?

Pour répondre à cette question, ajustez Profits ($M) en fonction de Type.

Découvrir la relation

1. Choisissez Aide > Dossier d'échantillons de données et ouvrez le fichier Companies.jmp.

2. Si la table d’échantillons de données Companies.jmp est toujours ouverte, il est possible que des lignes soient exclues ou masquées. Pour réinitialiser l'état de ces lignes — c'est-à-dire pour les inclure et les afficher toutes — choisissez Lignes > Effacer les états de ligne.

3. Choisissez Analyse > Ajuster Y en fonction de X.

4. Sélectionnez Profits ($M) et cliquez sur Y, Réponse.

5. Sélectionnez Type et cliquez sur X, Facteur.

6. Cliquez sur OK.

Figure 5.15 Bénéfices par type de société 

Profits by Company Type

Une valeur aberrante se détache pour le type Informatique. La valeur aberrante réduit l’échelle du graphique et complique de ce fait la comparaison des bénéfices. Excluez et masquez cette valeur aberrante :

1. Cliquez sur la valeur aberrante.

2. Choisissez Lignes > Exclure/Annuler l’exclusion. Le point n’est plus inclus dans les calculs.

3. Choisissez Lignes > Masquer/Afficher. Le point est masqué sur tous les graphiques.

4. Pour recréer le graphique sans la valeur aberrante, cliquez sur ANOVA à un facteur de Profits ($M) en fonction de Type et sélectionnez Refaire > Refaire l'analyse. Vous pouvez fermer la fenêtre Nuage de points initiale.

Figure 5.16 Graphique mis à jour 

Updated Plot

La suppression de la valeur aberrante permet à l’analyste financier d’avoir une image plus claire des données.

5. Pour poursuivre l'analyse de la relation, sélectionnez les options suivantes dans le triangle rouge situé en regard d’ANOVA à un facteur de Profits ($M) en fonction de Type :

Options d’affichage > Droites des moyennes. (Pour ajouter les droites des moyennes dans le nuage de points.)

Moyennes et écarts-types. (Pour afficher un rapport sur les moyennes et les écarts-types.)

Figure 5.17 Droites des moyennes et rapport 

Mean Lines and Report

Interpréter les résultats

L’analyste financier souhaite savoir quels sont les bénéfices des sociétés informatiques par rapport à ceux des sociétés pharmaceutiques. Le nuage de points mis à jour montre que les sociétés pharmaceutiques enregistrent des bénéfices moyens supérieurs à ceux des sociétés informatiques. Dans le rapport, la différence entre les deux moyennes est d'environ 635 millions de dollars. Le graphique indique également que certaines sociétés informatiques enregistrent des bénéfices négatifs et que toutes les sociétés pharmaceutiques réalisent des bénéfices positifs.

Réaliser le test de Student

L’analyste financier n’a examiné qu’un seul échantillon de sociétés (celles de la table de données). Il souhaite à présent étudier les questions suivantes :

Existe-t-il également une différence au sein de la population générale, ou la différence de 635 millions de dollars relève-t-elle du hasard ?

Si différence il y a, quelle est-elle ?

Pour répondre à ces questions, effectuez un test de Student sur deux échantillons. Un test de Student vous permet d'utiliser les données d'un échantillon pour tirer des conclusions sur une population plus vaste (dite « générale » ici).

Pour réaliser le test de Student, cliquez sur le triangle rouge ANOVA à un facteur et sélectionnez Moyennes/ANOVA/t groupé.

Figure 5.18 Résultats du test de Student 

t Test Results

La p-value 0,0001 est inférieure au niveau de significativité de 0,05, ce qui indique la significativité statistique. Par conséquent, l’analyste financier peut conclure que la différence observée entre les bénéfices moyens de l'échantillon de données est statistiquement significative. Au sein de la population générale, les bénéfices moyens des sociétés pharmaceutiques sont bien différents de ceux des sociétés informatiques.

Tirer les conclusions

Utilisez les limites de l’intervalle de confiance pour définir précisément la différence de bénéfices entre les deux types de société. Examinez les valeurs Limite de confiance supérieure (95 %) de la différence et Limite de confiance inférieure (95 %) de la différence de la Figure 5.18. L'analyste financier conclut que le bénéfice moyen des laboratoires pharmaceutiques est supérieur de 343 à 926 millions de dollars à celui des sociétés informatiques.

Vous voulez plus d'informations ? Avoir des questions? Obtenez des réponses dans la communauté d'utilisateurs JMP (community.jmp.com).