Le test de Student apparié
Qu'est-ce qu'un test de Student apparié ?
Le test de Student apparié est une méthode utilisée pour tester si la différence moyenne entre des paires de mesures est nulle ou pas.
Quand puis-je utiliser le test ?
Vous pouvez utiliser le test lorsque vos valeurs de données sont des mesures appariées. Par exemple, vous pourriez avoir des mesures avant et après pour un groupe de personnes. Par ailleurs, les différences entre les mesures appariées doivent être distribuées normalement.
Quels sont les autres noms pour des tests de Student appariés ?
Le test de Student apparié est également connu comme le test de Student des échantillons dépendants, le test de Student par différences appariées, le test de Student par grandeurs appariées et le test de Student par échantillons répétés.
Qu'en est-il si mes données ne sont pas distribuées presque normalement ?
Si la taille de votre échantillon est très petite, il peut s'avérer très difficile de tester la normalité. Vous pourriez avoir besoin de vous fier à votre propre compréhension des données. Lorsque vous ne pouvez pas supposer la normalité avec certitude, vous pouvez effectuer un test non paramétrique.
Utiliser le test de Student apparié
Les sections ci-dessous montrent ce qui est requis pour effectuer le test, vérifier nos données, la manière d'effectuer le test et les détails statistiques.
De quoi avons-nous besoin ?
Pour le test de Student apparié, nous avons besoin de deux variables. Une variable définit les paires pour les observations. La deuxième variable est une mesure. Parfois, nous avons déjà les différences appariées pour la mesure de la variable. À d'autres occasions, nous avons des variables séparées pour les mesures « avant » et « après » pour chaque paire et nous avons besoin de calculer les différences.
Nous avons également une idée ou une hypothèse que les différences entre les paires sont nulles. Voici trois exemples :
- Un groupe de personnes à la peau sèche utilise une lotion médicamenteuse sur un bras et une lotion non-médicamenteuse sur l'autre bras. Après une semaine, le docteur mesure la rougeur de chaque bras. Nous souhaitons savoir si la lotion médicamenteuse est meilleure que la lotion non-médicamenteuse. Nous faisons cela en déterminant si le bras avec la lotion médicamenteuse est moins rouge que l'autre bras. Comme nous avons des paires de mesures pour chaque personne, nous trouvons des différences. Puis, nous testons pour voir si la différence moyenne est nulle ou pas.
- Nous mesurons le poids des personnes dans un programme pour arrêter de fumer. Pour chaque personne, nous disposons du poids au début et à la fin du programme. Nous souhaitons savoir si le changement de poids moyen des personnes du programme est égal à zéro ou pas.
- Un instructeur donne aux étudiants un examen et le jour suivant, il donne aux étudiants un examen différent sur le même sujet. L'instructeur souhaite savoir si les deux examens sont aussi difficiles l'un que l'autre. Nous calculons la différence de notes d'examen pour chaque étudiant. Puis, nous testons pour voir si la différence moyenne est nulle ou pas.
Hypothèses du test de Student apparié
Pour appliquer le test de Student apparié afin de tester les différences entre des mesures appariées, les hypothèses suivantes doivent être vérifiées :
- Les sujets doivent être indépendants. Les mesures d'un sujet n'affectent pas les mesures des autres sujets.
- Chacune des mesures appariées doit être obtenue auprès du même sujet. Par exemple, le poids « avant » et « après » du fumeur dans l'exemple ci-dessus, doit provenir de la même personne.
- Les différences mesurées sont normalement distribuées.
Exemple de test de Student par paires
Une instructrice souhaite utiliser deux examens dans ses cours de l'année prochaine. Cette année, elle donne les deux examens à ses étudiants. Elle souhaite comparer la difficulté des deux examens et, pour ce faire, elle décide d'examiner les différences entre les notes. Si la différence moyenne entre les notes des étudiants est suffisamment proche de zéro, elle en tirera la conclusion pratique que les deux examens sont d'une difficulté égale. Voici les données :
Table de données 1 : Scores d'examen pour chaque étudiant
Étudiant | Notes d'examen 1 | Notes d'examen 2 | Différence |
Bob | 63 | 69 | 6 |
Nina | 65 | 65 | 0 |
Tim | 56 | 62 | 6 |
Kate | 100 | 91 | -9 |
Alonzo | 88 | 78 | -10 |
Jose | 83 | 87 | 4 |
Nikhil | 77 | 79 | 2 |
Julia | 92 | 88 | -4 |
Tohru | 90 | 85 | -5 |
Michael | 84 | 92 | 8 |
Jean | 68 | 69 | 1 |
Indra | 74 | 81 | 7 |
Susan | 87 | 84 | -3 |
Allen | 64 | 75 | 11 |
Paul | 71 | 84 | 13 |
Edwina | 88 | 82 | -6 |
Si vous examinez le tableau ci-dessus, vous verrez que certaines des différences de score sont positives et d'autres négatives. Vous pourriez donc penser que les deux examens sont de difficulté équivalente. D'autres pourraient penser le contraire. Le test statistique fournit un moyen commun de prendre une décision, afin que tout le monde prenne la même décision en se basant sur les mêmes données.
Vérifier les données
Commençons par répondre à la question suivante : le test de Student apparié est-il une méthode appropriée pour évaluer la différence de difficulté entre les deux examens ?
- Les sujets sont indépendants. Chaque étudiant effectue son propre travail sur les deux examens.
- Chacune des mesures appariées est obtenue auprès du même sujet. Chaque étudiant effectue les deux tests.
- La distribution des différences est normale. Pour le moment, nous supposerons que c'est vrai. Nous testerons cela plus tard.
Nous décidons que nous avons sélectionné une méthode d'analyse valide.
Avant de débuter l'analyse, nous devons représenter graphiquement les données. La figure ci-dessous montre un histogramme et un résumé statistique des différences de notes.
Dans l'histogramme, nous voyons qu'il n'y a aucun point très inhabituel ni de valeurs aberrantes. Les données ont approximativement une forme de cloche. Par conséquent, notre hypothèse d'une distribution normale des différences semble raisonnable.
Dans les statistiques, nous observons que la différence moyenne est de 1,3. Est-elle suffisamment proche de zéro pour que l'instructeur décide que les deux examens sont de difficultés équivalentes ? Ou pas ?
Comment effectuer un test de Student apparié ?
Nous expliquerons plus en détail les principes qui sous-tendent le test de Student apparié dans la section des détails statistiques ci-dessous, mais suivons d'abord les étapes du début à la fin. Commençons par calculer notre test statistique. Pour ce faire, nous avons besoin de la différence moyenne, de l'écart-type de la différence et de la taille d'échantillon. Ces éléments sont montrés dans la Figure 1 ci-dessus. (Remarquez que les statistiques sont arrondies à la valeur inférieure, à deux décimales près. Le logiciel montrera plus de décimales et les utilisera dans les calculs.)
La moyenne de la différence de notes est :
$ \overline{x_d} = 1,31 $
Ensuite, nous calculons l'erreur standard pour la différence de notes. Le calcul est :
$ \text{Erreur standard} = \frac{s_d}{\sqrt{n}} = \frac{7,00}{\sqrt{16}}2 = \frac{{7,00}}{4} = 1,75 $
Dans la formule ci-dessus, n est le nombre d'étudiants – qui est le nombre de différences. L'écart-type des différences est sd.
Nous avons désormais les pièces pour notre statistique de test. Nous calculons notre statistique de test de la manière suivante :
$ t = \dfrac{\text{Différence de moyenne}}{\text{Erreur standard}} = \frac{1,31}{1,75} = 0,750 $
Afin de prendre notre décision, nous comparons la statistique de test à une valeur de la distribution t. Cette activité comprend quatre étapes :
- Nous déterminons le risque que nous souhaitons prendre en déclarant une différence là où il n'y en a pas. Pour les données des notes d'examen, nous déterminons que nous sommes prêts à prendre un risque de 5 % en déclarant que la différence inconnue de moyennes des notes d'examen est nulle alors qu'en réalité, elle ne l'est pas. Statistiquement parlant, nous définissons le seuil de significativité, dénoté par α, à 0,05. Il est de bonne pratique de prendre cette décision avant de collecter les données et avant de calculer les statistiques de test.
- Nous calculons une statistique de test. Notre statistique de test est 0,750.
- Nous trouvons la valeur à partir de la distribution t. La plupart des livres de statistiques disposent de tableaux de référence pour la distribution. Vous pouvez aussi trouver des tableaux en ligne. Selon toute probabilité, vous allez utiliser un logiciel pour votre analyse et n'utiliserez pas des tableaux imprimés.
Pour trouver cette valeur, nous avons besoin du seuil de significativité (α = 0,05) et de degrés de liberté. Les degrés de liberté (df) sont basés sur la taille de l'échantillon. À partir des données des notes de l'examen, il s'agit de :
$ df = n - 1 = 16 - 1 = 15 $
La valeur t avec α = 0,05 et 15 degrés de liberté est 2,131. - Nous comparons la valeur de notre statistique (0,750) à la valeur t. Comme 0,750 < 2,131, nous ne pouvons rejeter notre idée que la différence de moyennes des notes est nulle. Nous en tirons la conclusion pratique que les examens sont de difficulté égale.
Informations statistiques
Examinons les scores de l'examen et le test de Student en utilisant des termes statistiques.
Notre hypothèse nulle est que la moyenne de population des différences est égale à zéro. L'hypothèse nulle est donc exprimée de la manière suivante :
$ H_o: \mathrm{\mu_d} = 0 $
L'hypothèse contraire est que la moyenne de population des différences n'est pas égale à zéro. Ceci est exprimé de la manière suivante :
$ H_o: \mathrm{\mu_d} \neq 0 $
Nous calculons l'erreur standard de la manière suivante :
$ Erreur standard = \frac{s_d}{\sqrt{n}} $
Dans cette formule, l'écart-type des différences est représenté par sd et la taille de l'échantillon par n.
Le test statistique est calculée de la manière suivante :
$ t = \frac{\mathrm{\mu_d}}{\frac{s}{\sqrt{n}}} $
Nous comparons le test statistique à une valeur t avec la valeur alpha et les degrés de liberté que nous avons choisis pour nos données. Dans notre exemple des scores d'examen, α = 0,05. Les degrés de liberté (df) sont basés sur la taille de l'échantillon et calculés de la manière suivante :
$ df = n - 1 = 16 - 1 = 15 $
Les statisticiens écrivent la valeur t avec α = 0,05 et 15 degrés de liberté sous la forme :
$ t_{0.05,15} $
La valeur t avec α = 0,05 et 15 degrés de liberté est de 2,131. Il y a deux résultats possibles à partir de notre comparaison :
- Le test statistique est inférieure à la valeur t. Vous ne parvenez pas à rejeter l'hypothèse que la différence des moyennes est égale à zéro. La conclusion pratique de l'instructrice est que les deux tests sont de difficulté équivalente. L'année prochaine, elle pourra utiliser les deux examens et donner à la moitié des étudiants un examen et à l'autre moitié le deuxième examen.
- Le test statistique est supérieure à la valeur t. Vous rejetez l'hypothèse que la différence des moyennes est égale à zéro. La conclusion pratique de l'instructrice est que les tests ne sont pas de difficulté équivalente. Elle doit utiliser le même examen pour tous les étudiants.
Tester la normalité
L'hypothèse de normalité est plus importante pour des tailles d'échantillons petites que pour des tailles d'échantillon plus grandes.
Les distributions normales sont symétriques ce qui signifie qu'elles sont identiques des deux côtés du centre. Les distributions normales n'ont pas de valeurs extrêmes ni de valeurs aberrantes. Vous pouvez vérifier ces deux fonctions d'une distribution normale avec des graphiques. Plus tôt, nous avons décidé que la distribution des différences de notes d'examen étaient « suffisamment proches » pour maintenir l'hypothèse de la normalité. La figure ci-dessous montre un graphique de quantiles normaux pour les données et conforte notre décision.
Vous pouvez également effectuer un test formel de normalité en utilisant un logiciel. La Figure 3 ci-dessous montre les résultats du test de normalité avec JMP. Nous testons la distribution des différences de score. Nous ne pouvons pas rejeter l'hypothèse d'une distribution normale. Nous pouvons utiliser le test de Student apparié.
Qu'en est-il si mes données ne sont pas issues d'une distribution normale ?
Si la taille de votre échantillon est très petite, sa normalité peut s'avérer difficile à tester. Dans cette situation, vous avez besoin de vous fier à votre propre compréhension des mesures. Par exemple, en ce qui concerne les données des scores de l'examen, l'instructrice sait que la distribution sous-jacente des différences de score est normale. Même pour un très petit échantillon, l'instructrice effectuera vraisemblablement le test de Student et supposera la normalité.
Que se passerait-il si vous saviez que les mesures sous-jacentes ne sont pas distribuées normalement ? Ou si la taille de votre échantillon est grande et que le test de normalité est rejeté ? Dans cette situation, vous pouvez utiliser des analyses non paramétriques. Ces types d'analyses ne dépendent pas de l'hypothèse selon laquelle les valeurs des données sont issues d'une distribution spécifique. Pour le test de Student apparié, le test des rangs signés de Wilcoxon est un test non paramétrique qui pourrait être utilisé.
Comprendre les p-values
En utilisant un visuel, vous pouvez vérifier si votre statistique de test est une valeur plus extrême dans la distribution. La distribution t est similaire à la distribution normale. La figure ci-dessous montre une distribution t avec 15 degrés de liberté.
Comme notre test est bilatéral et que nous avons défini α = 0,05, la figure montre que la valeur de 2,131 « coupe » 2,5 % des données dans chacune des deux extrémités. Par conséquent, seulement 5 % des données globales se trouvent au-delà de 2,131 dans les extrémités.
La Figure 5 montre où se situe notre résultat sur le graphique. Vous pouvez voir que le test statistique (0,75) n'est pas assez « loin dans l'extrémité » pour rejeter l'hypothèse d'une différence des moyennes égale à zéro.
Tout assembler avec un logiciel
Pour effectuer un test de Student apparié en situation réelle, vous utiliserez sans doute un logiciel la plupart du temps. La figure ci-dessous montre les résultats du test de Student apparié pour les données des notes d'examen en utilisant JMP.
Le logiciel montre des résultats pour un test bilatéral (Prob > |t|) et pour des tests unilatéraux. Nous utiliserons le test bilatéral. Notre hypothèse nulle est que la différence des moyennes entre les scores d'examen appariés est égale à zéro. Notre hypothèse contraire est que la différence des moyennes est différente de zéro.
Le logiciel montre une p-value de 0,4650 pour le test bilatéral. Cela signifie que la probabilité d'observer une différence moyenne de 1,31 ou plus dans un échantillon, lorsque la différence des moyennes de la population sous-jacente est égale à zéro, est d'environ 47 chances sur 100. Nous sommes donc convaincus qu'il ne faut pas rejeter l'hypothèse nulle. L'année prochaine, l'instructrice pourra utiliser les deux examens et donner à la moitié des étudiants un examen et à l'autre moitié le deuxième examen.