La distribution du khi-deux

Qu'est-ce qu'une distribution du khi-deux ?

La distribution du khi-deux est une distribution théorique des valeurs d'une population.

Comment la distribution du khi-deux est-elle utilisée ?

Elle est utilisée pour les tests statistiques où la statistique de test suit une distribution du khi-deux. Deux tests qui reposent sur la distribution du khi-deux sont le test du khi-deux de qualité de l'ajustement et le test du khi-deux d'indépendance.

 

Présentation de la distribution du khi-deux

La distribution du khi-deux est une famille de distributions. Chaque distribution est définie par les degrés de liberté (les degrés de liberté sont abordés plus en détail dans les pages consacrées au test de qualité de l'ajustement et au test d'indépendance). La figure ci-dessous montre trois distributions différentes du khi-deux avec différents degrés de liberté.

Figure 1 : Distribution du khi-deux avec différents degrés de liberté

Vous pouvez constater que la courbe bleue avec 8 degrés de liberté ressemble quelque peu à une courbe normale (la fameuse courbe en cloche). Mais elle a une extrémité plus longue à droite qu'une distribution normale et n'est pas symétrique. Comparez la courbe bleue à la courbe orange avec 4 degrés de liberté. La courbe orange est très différente d'une courbe normale. La courbe violette possède 3 degrés de liberté et ressemble encore moins à une courbe normale que les deux autres.

Plus le nombre de degrés de liberté d'une distribution du khi-deux est élevé, plus elle ressemble à une distribution normale.

Utiliser des tableaux de distribution du khi-deux publiés

La plupart des gens utilisent un logiciel pour effectuer des tests du khi-deux. Mais de nombreux livres de statistiques contiennent encore des tableaux de distribution du khi-deux, il peut donc s'avérer utile de comprendre comment les utiliser. Les étapes ci-dessous décrivent comment utiliser un tableau typique de distribution du khi-deux.

  1. Identifiez le niveau alpha. Chaque colonne du tableau répertorie les valeurs des différents niveaux alpha. Si vous avez défini α = 0,05 pour votre test, alors trouvez la colonne pour α = 0,05.
  2. Identifiez les degrés de liberté pour le test que vous effectuez et pour vos données. Les lignes d'un tableau de distribution du khi-deux correspondent aux différents degrés de liberté. La plupart des tableaux vont jusqu'à 30 degrés de liberté.
  3. Retrouvez la cellule dans le tableau correspondant à votre niveau alpha et à vos degrés de liberté. Il s'agit de la valeur de la distribution du khi-deux. Comparez votre statistique de test à la valeur de la distribution et tirez-en la conclusion appropriée.