Le test du khi-deux

Qu'est-ce que le test du khi-deux ?

Un test du khi-deux est une méthode de test des hypothèses. Deux tests du khi-deux courants impliquent de vérifier si les fréquences observées dans une ou plusieurs catégories correspondent aux fréquences attendues.

Le test du khi-deux est-il identique au test χ² ?

Oui, χ est le symbole grec pour khi.

Quelles sont mes possibilités ?

Si vous n'avez qu'une seule variable de mesure, vous utilisez untest du khi-deux de qualité de l’ajustement. Si vous avez deux variables de mesure, vous utilisez un test du khi-deux d'indépendance. Il existe d'autres tests du khi-deux, mais ces deux-là sont les plus courants.

Types de tests du khi-deux

Vous utilisez un test du khi-deux pour tester des hypothèses afin de déterminer si les données sont conformes aux attentes. L'idée de base qui sous-tend le test est de comparer les valeurs observées dans vos données aux valeurs attendues si l'hypothèse nulle est vraie.

Il existe deux tests du khi-deux couramment utilisés : le test du khi-deux de qualité de l'ajustement et le test du khi-deux d'indépendance. Les deux tests impliquent des variables qui divisent vos données en différentes catégories. Par voie de conséquence, il peut s'avérer difficile de savoir quel test utiliser. Le tableau ci-dessous compare les deux tests.

Rendez-vous sur les pages individuelles pour chaque type de test du khi-deux pour voir des exemples ainsi que des détails concernant les hypothèses et les calculs.

Tableau 1 : Choisir un test du khi-deux

 

Test du khi-deux de qualité de l'ajustement

Test du khi-deux d'indépendance

Nombre de variablesONEDeux
Objectif du testDécider si une variable est probablement issue d'une distribution donnée ou pasDécider si des variables sont probablement liées ou pas
ExempleDécider si des sacs de bonbons ont le même nombre d'éléments de chaque saveur ou pasDécider si la décision des spectateurs de films d'acheter des snacks est liée au type de film qu'ils ont l'intention de voir
Exemples d'hypothèses

Ho : les proportions de saveurs de bonbons sont égales

Ha : les proportions de saveurs ne sont pas les mêmes

Ha  : la proportion de personnes qui achètent des snacks est indépendante du type de film

Ha : la proportion de personnes qui achètent des snacks est différente pour différents types de films

Distribution théorique utilisée dans le testKhi-deuxKhi-deux
Degrés de liberté

Nombre de catégories moins 1

  • Dans notre exemple, le nombre de saveurs de bonbons moins 1

Nombre de catégories pour la première variable moins 1, multiplié par le nombre de catégories pour la deuxième variable moins 1

  • Dans notre exemple, le nombre de catégories de films moins 1, multiplié par 1 (car l'achat de snacks est une variable Oui/Non et 2-1 = 1).

 

Comment effectuer un test du khi-deux ?

Suivez les étapes d'analyse décrites ci-dessous à la fois pour le test du khi-deux de qualité de l'ajustement et le test du khi-deux d'indépendance. Rendez-vous sur les pages de chaque type de test pour voir ces étapes en action.

  1. Définissez votre hypothèse nulle et votre hypothèse alternative avant de collecter les données.
  2. Décidez la valeur alpha. Ceci implique de décider le risque que vous êtes prêts à prendre en tirant une mauvaise conclusion. Par exemple, supposons que vous définissiez α = 0,05 lors du test d'indépendance. Dans ce cas, vous avez décidé de prendre un risque de 5 % de conclure que les deux variables sont indépendantes alors qu'en réalité elles ne le sont pas.
  3. Vérifiez les données à la recherche d'erreurs.
  4. Vérifiez les hypothèses pour le test. (Rendez-vous sur les pages de chaque type de test pour plus de détails sur les hypothèses.)
  5. Effectuez le test et tirez-en votre conclusion.


Les deux tests du khi-deux dans le tableau ci-dessus impliquent le calcul d'une statistique de test. L'idée de base de ce le test est de comparer les valeurs observées dans vos données aux valeurs attendues si l'hypothèse nulle est vraie. Le test statistique implique de trouver la différence au carré entre les valeurs de données observées et attendues, et de diviser cette différence par les valeurs de données attendues. Vous faites cela pour chaque point de données et ajoutez les valeurs.

Ensuite, vous comparez la statistique de test à la valeur théorique à partir de la distribution khi-deux. La valeur théorique dépend à la fois de la valeur alpha et des degrés de liberté de vos données. Rendez-vous sur les pages de chaque type de test pour des exemples détaillés.