Z-Score

Qu'est-ce que le score Z ?

Le score Z est une mesure standardisée de l'écart entre une valeur donnée et la moyenne d'un jeu de données normalement distribué.

Comment le score Z est-il utilisé ?

Le score Z fournit une échelle uniforme pour exprimer dans quelle mesure un point de données particulier est éloigné de la moyenne. Il permet ainsi d'identifier les valeurs aberrantes et de comparer des données provenant de distributions différentes. Le score Z offre également un moyen rapide d'appliquer la règle empirique. Par exemple, il est possible de vérifier rapidement si 95 % des valeurs d'un jeu de données se situent à l'intérieur de deux écarts-types en vérifiant le pourcentage de valeurs dont le score Z est compris entre −2 et 2.

Comment calculer le score Z ?

Pour calculer le score Z, il suffit de soustraire la moyenne à une valeur de donnée, puis de diviser par l'écart-type.

Utiliser le score Z

Découvrez comment calculer les scores Z à l'aide d'un logiciel statistique

Le score Z (ou « z-score » en anglais) mesure l'écart entre la moyenne et chacune des valeurs de vos données à l'aide d'une échelle standardisée. Vos données brutes sont converties selon une opération appelée « distribution Z » (ou « z-distribution » en anglais). Il s'agit d'une distribution normale standard, avec une moyenne de 0 et un écart-type de 1.

Pourquoi convertir les données en scores Z ?

La conversion en score Z facilite l'application de la règle empirique. Par exemple, puisque l'écart-type de la distribution Z est de 1, cela signifie qu'environ 95 % des valeurs se situent entre −2 et +2.

La conversion en score Z permet d'évaluer la distance par rapport à la moyenne sur une échelle standardisée. Avant que les ordinateurs ne soient largement répandus, les manuels de statistique contenaient des tableaux de distribution normale standardisée, ce qui permettait aux apprenants de trouver des distances par rapport à la moyenne plus précises que les écarts-types de un, deux et trois de la règle empirique.

Conversion en score Z : mode d'emploi

Pour convertir une valeur, soustrayez la moyenne à la valeur, puis divisez par l'écart-type. Le résultat est appelé « score Z » (ou « score standard »). En théorie, on est censé utiliser la moyenne et l'écart-type de la population. En pratique, on utilise généralement la moyenne et l'écart-type de l'échantillon.

Prenons un exemple pour mieux comprendre.

Nous nous limitons à quelques valeurs pour des raisons de simplicité. Supposons que vous mesuriez la fréquence cardiaque. Chez la plupart des gens, elle est comprise entre 60 et 100 battements par minute (bpm). Les valeurs que vous avez mesurées sont alors les suivantes :

55
60
65
75
80
85

La moyenne de ces valeurs est de 70 et l'écart-type est de 11,8. (Ces calculs sont présentés dans les pages consacrées à la moyenne et à l'écart-type.)

Supposons que l'on vous demande si la valeur de 55 se situe à l'intérieur de deux écarts-types. Vous pouvez répondre à cette question en utilisant la moyenne et l'écart-type pour calculer la valeur qui est à deux écarts-types de 70. Ce calcul est le suivant :

70 − (2 x 11,8) = 70 − 23,6 = 46,4

Puisque 55 se situe dans l'intervalle de 46,4 à 70, 55 se situe à deux écarts types de la moyenne.

Vous pouvez également calculer les scores Z. Petit rappel : pour calculer les scores Z d'un jeu de valeurs, il suffit de soustraire la moyenne à chaque valeur et de diviser par l'écart-type. Voici les scores Z pour nos mesures de la fréquence cardiaque :

DonnéesZ-Score
55(55 − 70) / 11,8 = −1,27
60(60 − 70) / 11,8 = −0,85
65(65 − 70) / 11,8 = −0,42
75(75 − 70) / 11,8 = 0,42
80(80 − 70) / 11,8 = 0,85
85(85 − 70) / 11,8 = 1,27

Nous constatons que la valeur de 55 se situe à l'intérieur de deux écarts-types. En fait, elle se situe à 1,27 écart-type en dessous de la moyenne.

Nous avons utilisé la moyenne et l'écart-type de l'échantillon pour calculer nos scores Z, ce qui est une pratique courante en statistique, même si nous devrions en principe nous baser sur la moyenne et l'écart-type de la population.