Le test de Student

Qu'est-ce qu'un test de Student ?

Un test de Student, également connu sous le nom de test t de Student, est un outil permettant d'évaluer les moyennes d'une ou deux populations à l'aide d'un test d'hypothèse. Un test de Student peut être utilisé pour évaluer si un seul groupe diffère d'une valeur connue (test t à un échantillon), si deux groupes diffèrent l'un de l'autre (test t à deux échantillons indépendants), ou s'il existe une différence significative dans des mesures appariées (test de Student apparié ou à échantillons dépendants).

Comment les tests de Student sont-ils utilisés ?

Tout d'abord, vous définissez l'hypothèse que vous allez tester et spécifiez un risque acceptable de tirer une conclusion erronée. Par exemple, lorsque vous comparez deux populations, vous pouvez émettre l'hypothèse que leurs moyennes sont les mêmes, et vous décidez d'une probabilité acceptable de conclure qu'il existe une différence alors que ce n'est pas le cas. Ensuite, vous calculez une statistique de test à partir de vos données et vous la comparez à une valeur théorique issue d'une distribution t. Selon le résultat, vous rejetez ou non l'hypothèse nulle.

Que faire si j'ai plus de deux groupes ?

Vous ne devez pas utiliser le test de Student, mais une méthode de comparaisons multiples, comme l'analyse de la variance (ANOVA), la comparaison par paire de Tukey-Kramer, la comparaison de Dunnett à un contrôle et l'analyse des moyennes (ANOM).

Hypothèses du test de Student

Bien que les tests de Student soient relativement robustes aux écarts par rapport aux hypothèses, les tests t supposent tout de même que :

  • Les données sont continues.
  • Les exemples de données ont été prélevés de manière aléatoire dans une population.
  • Il y a homogénéité de la variance (c'est-à-dire que la variabilité des données dans chaque groupe est similaire).
  • La distribution est approximativement normale.

Pour les tests de Student à deux échantillons, ces derniers doivent être indépendants. Si les échantillons ne sont pas indépendants, un test t apparié sera probablement plus approprié.

Types de tests de Student

Il existe trois tests de Student pour comparer les moyennes : un test de Student à un échantillon, un test de Student à deux  échantillons et un test de Student apparié. Le tableau ci-dessous résume les caractéristiques de chaque test et fournit des directives pour choisir le test adéquat. Rendez-vous sur les pages de chaque type de test de Student pour des examples ainsi que des details concernant les hypothèses et les calculs.

 Test de Student à un échantillonTest de Student à deux échantillonsTest de Student apparié
SynonymesTest de Student
  • Test de Student par groupes indépendants
  • Test de Student par échantillons indépendants
  • Test de Student par variances égales
  • Test de Student groupé
  • Test de Student par variances inégales
  • Test de Student par groupes appariés
  • Test de Student par échantillons dépendants
Nombre de variablesONEDeuxDeux
Type de variable
  • Mesures continues
  • Mesures continues
  • Catégorielle ou nominale pour définir les groupes
  • Mesures continues
  • Catégorielle ou nominale pour définir les paires dans les groupes
Objet du testDécider si la moyenne de population est égale à la valeur spécifique ou pasDécider si les moyennes de population pour deux groupes différents sont égales ou pas.Décider si la différence entre des mesures appariées pour la population est nulle ou pas.
Exemple : Tester si...la fréquence cardiaque moyenne d'un groupe de personnes est égale à 65 ou pasles fréquences cardiaques moyennes pour deux groupes de personnes sont identiques ou pasla différence des moyennes des fréquences cardiaques pour un groupe de personnes avant et après le sport est nulle ou pas
Estimation de la moyenne de la populationMoyenne de l'échantillonMoyenne de l'échantillon pour chaque groupeMoyenne de l'échantillon des différences dans les mesures appariées
Écart-type de la populationInconnu, utilisez l'écart-type de l'échantillonInconnu, utilisez les écarts-types de l'échantillon pour chaque groupeInconnu, utilisez l'écart-type de l'échantillon des différences dans les mesures appariées
Degrés de libertéNombre d'observations dans l'échantillon moins 1, ou :
n–1
Somme des observations dans chaque échantillon moins 2, ou :
n1 + n2 – 2
Nombre d'observations dans l'échantillon moins 1, ou :
n–1

Le tableau ci-dessus ne montre que les tests de Student pour les moyennes de population. Un autre test de Student courant porte sur les coefficients de corrélation. Ce test de Student est utilisé pour décider si le coefficient de corrélation est sensiblement différent de zéro.

Tests à une extrémité vs tests à deux extrémités

Lorsque vous définissiez l'hypothèse, vous définissez également si vous avez un test à une extrémité ou à deux extrémités. Vous devez prendre cette décision avant de collecter vos données ou d'effectuer des calculs. Vous prenez cette décision pour les trois tests de Student pour des moyennes.

Pour l'expliquer, utilisons un test de Student à un échantillon. Supposons que nous disposons d'un échantillon aléatoire de barres protéinées et que l'étiquette pour les barres indique 20 grammes de protéines par barres. L'hypothèse nulle est que la moyenne de population inconnue est 20. Supposons que nous voulons simplement connaître si les données montrent que nous avons une moyenne de population différente. Dans cette situation, nos hypothèses sont :

$ \mathrm H_o: \mu = 20 $

$ \mathrm H_a: \mu \neq 20 $

Ici, nous avons un test à deux extrémités. Nous utiliserons les données pour voir si la moyenne de l'échantillon diffère suffisamment de 20 – si elle est soit inférieure, soit supérieure – pour conclure que la moyenne de population inconnue est différente de 20.

Supposons plutôt que nous souhaitons savoir si la publicité sur l'étiquette est correcte. Est-ce que les données soutiennent l'idée que la moyenne de population inconnue est d'au moins 20 ? Ou pas ? Dans cette situation, nos hypothèses sont :

$ \mathrm H_o: \mu >= 20 $

$ \mathrm H_a: \mu < 20 $

Ici, nous avons un test à une extrémité. Nous allons utiliser les données pour voir si la moyenne de l'échantillon est suffisamment inférieure à 20 pour rejeter l'hypothèse selon laquelle la moyenne de population inconnue est supérieure ou égale à 20.

Voir la section « Les extrémités pour les tests d'hypothèses » sur la page Distribution t pour des images qui illustrent les concepts pour des tests à une et deux extrémités.

Comment effectuer un test de Student ?

Pour tous les tests de Student impliquant des moyennes, vous passez par les mêmes étapes d'analyse :

  1. Définissez votre hypothèse nulle ($ \mathrm H_o $) et votre hypothèse contraire ($ \mathrm H_a $) avant de collecter les données.
  2. Décidez de la valeur alpha (ou valeur α). Il s'agit de déterminer le risque que vous êtes prêt à prendre de tirer une conclusion erronée. Par exemple, supposons que vous définissiez α = 0,05 lorsque vous comparez deux groupes indépendants. Dans ce cas, vous acceptez un risque de 5 % de conclure que les moyennes de population inconnues sont différentes alors qu'elles ne le sont pas.
  3. Vérifier les données à la recherche d'erreurs.
  4. Vérifiez les hypothèses pour le test.
  5. Effectuez le test et tirez-en votre conclusion. Tous les tests de Student pour les moyennes impliquent le calcul d'une statistique de test. Vous comparez la statistique de test à une valeur théorique de la distribution t. La valeur théorique implique à la fois la valeur α et les degrés de liberté de vos données. Pour plus de détails, consultez les pages consacrées au test de Student à un échantillon, au test de Student à deux échantillons et au test de Student apparié.