Test de Student pour échantillon unique
Qu'est-ce que le test de Student pour échantillon unique ?
Le test de Student à un échantillon est un test d'hypothèse statistique utilisé pour déterminer si la moyenne d'une population inconnue est différente d'une valeur spécifique.
Quand puis-je utiliser le test ?
Vous pouvez utiliser le test pour des données continues. Vos données doivent représenter un échantillon aléatoire issu d'une population normale.
Qu'en est-il si mes données ne sont pas distribuées presque normalement ?
Si la taille de votre échantillon est très petite, il peut s'avérer très difficile de tester la normalité. Vous pourriez avoir besoin de vous fier à votre propre compréhension des données. Lorsque vous ne pouvez pas supposer la normalité avec certitude, vous pouvez effectuer un test non paramétrique qui ne suppose pas la normalité.
Utiliser un test de Student pour échantillon unique
Les sections ci-dessous montrent ce qui est requis pour le test, vérifier nos données, effectuer le test et les détails statistiques.
De quoi avons-nous besoin ?
Pour un test de Student pour échantillon unique, nous avons besoin d'une variable.
Nous avons également l'idée ou l'hypothèse que la moyenne de la population a une certaine valeur. Voici deux exemples :
- Un hôpital dispose d'un échantillon aléatoire de mesures de cholestérol pour les hommes. Ces patients ont été examinés pour des problèmes autres que leur cholestérol. Ils ne prenaient aucun médicament pour diminuer leur niveau de cholestérol. L'hôpital souhaite déterminer si la moyenne inconnue de cholestérol pour les patients est différente du niveau cible de 200 mg.
- Nous mesurons les grammes de protéines pour un échantillon de barres énergétiques. L'étiquette prétend que les barres ont 20 grammes de protéines. Nous souhaitons savoir si les étiquettes sont correctes ou pas.
Hypothèses du test de Student pour échantillon unique
Pour un test valide, nous avons besoin des valeurs de données :
- Indépendantes (les valeurs ne sont pas liées les unes aux autres).
- Continues.
- Obtenues via un échantillon aléatoire simple de la population.
Par ailleurs, on suppose que la population est distribuée normalement.
Exemple de test de Student pour échantillon unique
Imaginez que nous ayons collecté un échantillon aléatoire de 31 barres énergétiques d'un nombre de magasins différents, qui représentent la population de barres énergétiques disponibles pour le consommateur ordinaire. Les étiquettes sur les barres indiquent que chaque barre contient 20 g de protéines.
Tableau 1 : Grammes de protéines dans un échantillon aléatoire de barres énergétiques
Barre énergétique - Grammes de protéines | ||||||
---|---|---|---|---|---|---|
20,70 | 27,46 | 22,15 | 19,85 | 21,29 | 24,75 | |
20,75 | 22,91 | 25,34 | 20,33 | 21,54 | 21,08 | |
22,14 | 19,56 | 21,10 | 18,04 | 24,12 | 19,95 | |
19,72 | 18,28 | 16,26 | 17,46 | 20,53 | 22,12 | |
25,06 | 22,44 | 19,08 | 19,88 | 21,39 | 22,33 | 25,79 |
Si vous regardez le tableau ci-dessus, vous voyez que certaines barres ont moins de 20 grammes de protéines. D'autre barres en ont plus. Vous pourriez penser que les données corroborent l'idée que les étiquettes sont correctes. D'autres pourraient ne pas être du même avis. Le test statistique fournit une méthode fiable pour prendre une décision de manière à ce que tout le monde puisse prendre la même décision avec le même ensemble de valeurs de données.
Vérifier les données
Commençons par répondre à la question suivante : le test de Student est-il une méthode appropriée pour tester si les barres d'énergie ont 20 grammes de protéines ? La liste ci-dessous vérifie les exigences du test.
- Les valeurs de données sont indépendantes. Les grammes de protéines dans une barre énergétique ne dépendent pas des grammes dans n'importe quelle autre barre énergétique. Un exemple de valeurs dépendantes serait si vous preniez des barres énergétiques d'un même lot de production. Un échantillon issu d'un seul lot est représentatif de ce lot uniquement et non des barres énergétiques en général.
- Les valeurs de données sont exprimées en grammes de protéines. Les mesures sont continues.
- Nous supposons que les barres énergétiques sont un échantillon aléatoire simple d'une population de barres énergétiques disponibles pour le consommateur ordinaire (par ex. : un mélange de lots de barres).
- Nous supposons que la population dans laquelle nous collectons notre échantillon est distribuée normalement et, pour les grands échantillons, nous pouvons vérifier cette hypothèse.
Nous décidons que le test de Student est une méthode appropriée.
Avant de débuter l'analyse, nous examinons brièvement les données. La figure ci-dessous montre un histogramme et un résumé statistique des barres énergétiques.
À partir d'un examen rapide de l'histogramme, nous ne voyons aucun point inhabituel ni de valeurs aberrantes. Les données ont plus ou moins une forme de cloche. Par conséquent, notre hypothèse d'une distribution normale semble raisonnable.
À partir d'un examen rapide des statistiques, nous observons que la moyenne est de 21,4 – supérieure à 20. Est-ce que cette moyenne de notre échantillon de 31 barres annule l'affirmation de l'étiquette de 20 grammes de protéines pour la moyenne de l'ensemble de la population inconnue ? Ou pas ?
Comment effectuer un test de Student à un échantillon ?
Pour les calculs du test de Student, nous avons besoin de la moyenne, de l'erreur standard et de la taille de l'échantillon. Ces valeurs sont données dans la section de résumé statistique de la Figure 1 ci-dessus.
Nous arrondissons les statistiques à une valeur avec deux décimales. Le logiciel montrera plus de décimales et les utilisera dans les calculs. (Remarquez que le Tableau 1 montre seulement deux décimales ; les données observées qui sont utilisées pour calculer le résumé statistique en ont plus.)
Nous commençons par trouver la différence entre la moyenne de l'échantillon et 20 :
$ 21,40-20\ =\ 1,40$
Ensuite, nous calculons l'erreur standard pour la moyenne. Le calcul est :
Erreur standard pour la moyenne = $ \frac{s}{\sqrt{n}}= \frac{2,54}{\sqrt{31}}=0,456 $
Cela correspond à la valeur dans la Figure 1 ci-dessus.
Nous avons désormais les éléments pour notre test statistique. Nous calculons notre test statistique de la manière suivante :
$ t = \frac{{\text{{Différence}}}}{{\text{{Erreur standard}}}}= \frac{{1,40}}{{0,456}}=3,07 $
Afin de prendre notre décision, nous comparons la statistique de test à la valeur de la distribution t. Cette activité comprend quatre étapes.
- Nous calculons la statistique de test. Notre statistique de test est 3,07.
- Nous déterminons le risque que nous souhaitons prendre en déclarant une différence là où il n'y en a pas. Pour les données des barres énergétiques, nous déterminons que nous sommes disposés à prendre un risque de 5 % en déclarant que la moyenne de population inconnue est différente de 20 alors qu'elle ne l'est pas en réalité. Statistiquement parlant, α = 0,05. En pratique, vous devez définir votre niveau de risque (α) avant de collecter les données.
Nous trouvons la valeur d'une distribution t en fonction de notre décision. Pour un test de Student, nous avons besoin de degrés de liberté pour trouver cette valeur. Les degrés de liberté sont basés sur la taille de l'échantillon. Pour les données concernant les barres énergétiques :
Degrés de liberté = $ n - 1 = 31 - 1 = 30 $
La valeur critique de t avec α = 0,05 et 30 degrés de liberté est +/- 2,043. La plupart des livres de statistiques disposent de tableaux de référence pour la distribution. Vous pouvez aussi trouver des tableaux en ligne. Selon toute vraisemblance, vous utiliserez le logiciel et vous n'utiliserez pas de tableaux imprimés.
Nous comparons la valeur de notre statistique à la valeur t. Puisque 3,07 > 2,043, nous rejetons l'hypothèse nulle selon laquelle la moyenne des grammes de protéines est égale à 20. Nous en tirons une conclusion pratique selon laquelle les étiquettes sont incorrectes et la moyenne des grammes de protéines de la population est supérieure à 20.
Informations statistiques
Observons les données relatives aux barres d'énergie et au test de Student pour échantillon unique en utilisant des termes statistiques.
Notre hypothèse nulle est que la moyenne de la population sous-jacente est égale à 20. L'hypothèse nulle est exprimée de la manière suivante :
$ H_o: \mathrm{\mu} = 20 $
L'hypothèse alternative est que la moyenne de la population sous-jacente n'est pas égale à 20. Les étiquettes indiquant 20 grammes de protéines seraient incorrectes. Ceci est exprimé de la manière suivante :
$ H_a: \mathrm{\mu} ≠ 20 $
Il s'agit d'un test bilatéral. Nous testons pour voir si la moyenne de la population est différente des 20 grammes dans les deux sens. Si nous pouvons rejeter l'hypothèse nulle selon laquelle la moyenne est égale à 20 grammes, nous en tirons une conclusion pratique selon laquelle les étiquettes des barres sont incorrectes. Si nous ne pouvons pas rejeter l'hypothèse nulle, nous en tirons la conclusion pratique que les étiquettes des barres pourraient être correctes.
Nous calculons la moyenne pour l'échantillon puis nous calculons la différence avec la moyenne de population, mu :
$ \overline{x} - \mathrm{\mu} $
Nous calculons l'erreur standard de la manière suivante :
$ \frac{s}{ \sqrt{n}} $
Cette formule montre l'erreur standard de l'échantillon comme s et la taille de l'échantillon comme n.
La statistique de test utilise la formule exprimée ci-dessous :
$ \dfrac{\overline{x} - \mathrm{\mu}} {s / \sqrt{n}} $
Nous comparons la statistique de test à une valeur t avec notre valeur alpha choisie et les degrés de liberté avec nos données. En utilisant les données de la barre énergétique comme exemple, nous définissons α = 0,05. Les degrés de liberté (df) sont basés sur la taille de l'échantillon et calculés de la manière suivante :
$ df = n - 1 = 31 - 1 = 30 $
Les statisticiens écrivent la valeur t avec α = 0,05 et 30 degrés de liberté sous la forme :
$ t_{0.05,30} $
La valeur t pour un test bilatéral avec α = 0,05 et 30 degrés de liberté est +/- 2,042. Il y a deux résultats possibles à partir de notre comparaison :
- La statistique de test est moins extrême que les valeurs t critiques ; en d'autres termes, la statistique de test n'est pas inférieure à -2,042 ou n'est pas supérieure à +2,042. Vous échouez à rejeter l'hypothèse nulle selon laquelle la moyenne est égale à la valeur spécifiée. Dans notre exemple, vous ne pourriez par conclure que l'étiquette pour les barres de protéines doit être modifiée.
- Le test statistique est moins extrême que les valeurs t critiques ; en d'autres termes, le test statistique n'est pas inférieur à -2,042 ou n'est pas supérieur à +2,042. Vous rejetez l'hypothèse nulle selon laquelle la moyenne est égale à la valeur spécifiée. Dans notre exemple, vous concluez que l'étiquette doit être mise à jour ou bien que le processus de production doit être amélioré de façon à produire, en moyenne, des barres qui contiennent 20 grammes de protéines.
Tester la normalité
L'hypothèse de normalité est plus importante pour des tailles d'échantillons petites que pour des tailles d'échantillon plus grandes.
Les distributions normales sont symétriques ce qui signifie qu'elles sont « à égalité » des deux côtés du centre. Les distributions normales n'ont pas des valeurs extrêmes ni des valeurs aberrantes. Vous pouvez vérifier ces deux fonctions d'une distribution normale avec des graphiques. Plus tôt, nous avons décidé que les données des barres énergétiques étaient « suffisamment proches » de la normale pour maintenir l'hypothèse de la normalité. La figure ci-dessous montre un graphique de quantiles normaux pour les données et conforte notre décision.
Vous pouvez également effectuer un test formel de normalité en utilisant un logiciel. La figure ci-dessous montre les résultats du test de normalité avec le logiciel JMP. Nous ne pouvons rejeter l'hypothèse d'une distribution normale.
Nous pouvons maintenir l'hypothèse selon laquelle les données des barres énergétiques sont distribuées normalement.
Qu'en est-il si mes données ne sont pas issues d'une distribution normale ?
Si la taille de votre échantillon est très petite, sa normalité peut s'avérer difficile à tester. Dans cette situation, vous pourriez avoir besoin de vous fier à votre propre compréhension des mesures. Par exemple, pour les données des barres énergétiques, l'entreprise sait que la distribution sous-jacente de grammes de protéines est distribuée normalement. Même pour un très petit échantillon, l'entreprise continuera vraisemblablement avec le test de Student et supposera la normalité.
Que se passerait-il si vous saviez que les mesures sous-jacentes ne sont pas distribuées normalement ? Ou si la taille de votre échantillon est grande et que le test de normalité est rejeté ? Dans cette situation, vous pouvez utiliser un test non paramétrique. Les analyses non paramétriques ne dépendent pas de l'hypothèse selon laquelle les valeurs des données sont issues d'une distribution spécifique. Pour le test de Student pour échantillon unique, le seul test non paramétrique possible est le test des rangs signés de Wilcoxon.
Comprendre les p-values
En utilisant un visuel, vous pouvez vérifier si votre statistique de test est une valeur plus extrême que la valeur spécifiée dans la distribution. La figure ci-dessous montre une distribution t avec 30 degrés de liberté.
Comme notre texte est bilatéral et que nous avons défini α = 0,05, la figure montre que la valeur 2,042 « coupe » 5 % des données dans les extrémités combinées.
La figure suivante montre nos résultats. Vous pouvez observer que la statistique de test tombe au-dessus de la valeur critique spécifiée. Elle est suffisamment « éloignée dans l'extrémité » pour rejeter l'hypothèse que la moyenne est égale à 20.
Tout assembler avec un logiciel
Vous allez vraisemblablement utiliser un logiciel pour effectuer un test de Student. La figure ci-dessous montre les résultats pour un test de Student pour échantillon unique pour les données des barres énergétiques avec le logiciel JMP.
Le logiciel montre la valeur d'hypothèse nulle de 20 et l'écart moyen et l'écart-type à partir des données. La statistique de test est 3,07. Cela correspond aux calculs ci-dessus.
Le logiciel montre des résultats pour un test bilatéral et pour des tests unilatéraux. Nous voulons un test bilatéral. Notre hypothèse nulle est que la moyenne des grammes de protéines est égale à 20. Notre hypothèse alternative est que la moyenne des grammes de protéines n'est pas égale à 20. Le logiciel montre une p-value de 0,0046 pour le test bilatéral. La p-value décrit la vraisemblance de voir une moyenne d'échantillon aussi extrême que 21,4, ou encore plus extrême, alors que la moyenne de la population sous-jacente est en réalité de 20 : en d'autres termes, la probabilité d'observer une moyenne d'échantillons aussi différente, ou encore plus différente, que 20 par rapport à la moyenne que nous avons observée dans notre échantillon. Une p-value de 0,0046 signifie qu'il y a environ 46 chances sur 10 000. Nous rejetons avec certitude l'hypothèse nulle que la moyenne de population est égale à 20.