La règle empirique
Qu'est-ce que la règle empirique ?
La règle empirique résume le pourcentage de données d'une distribution normale qui se situent à l'intérieur d'un, de deux ou de trois écarts-types de la moyenne.
Quelles sont les conditions requises pour utiliser la règle empirique ?
Vos données doivent être distribuées normalement.
Définition de la règle empirique
Lorsque vous disposez de données normales, la règle empirique vous permet de les comprendre rapidement. Cette règle est également appelée la « règle 68-95-99,7 % » ou la « règle des trois sigmas ». La règle désigne le pourcentage de données qui se situent à l'intérieur d'un, de deux ou de trois écarts-types de la moyenne.
Se référer au graphique d'une distribution normale (Figure 1) permet de comprendre plus facilement cette notion. Le centre du graphique (zéro sur l'axe X) représente la moyenne des données. Les lignes verticales en pointillés orange sont tracées à un, deux et trois écarts-types par rapport à la moyenne.
Notez qu'environ 68 % des données se situent à moins d'un écart-type de la moyenne. Rappelez-vous que la distribution normale est une distribution théorique de la population. L'écart-type de la population utilise le symbole s.Parfois, vous verrez cette règle écrite sous la forme suivante : « 68 % des données se situent à ±s de la moyenne ».
De même, vous pouvez constater qu'environ 95 % des données se situent à moins de deux écarts-types de la moyenne. Ceci est souvent exprimé comme suit : « 95 % des données se situent à ±2 s de la moyenne ».
Enfin, environ 99,7 % des données se situent à moins de trois écarts-types de la moyenne, ce qui est souvent écrit ainsi : « 99,7 % des données se situent à ±3 s de la moyenne ».
En pratique, vous connaîtrez rarement les véritables moyenne ou écart-type de la population. Au lieu de cela, vous ferez une estimation basée sur la moyenne et l'écart-type de l'échantillon, puis vous utiliserez cette règle.
Comment utiliser la règle empirique
Comment appliquer la règle empirique à l'analyse de vos données ? En supposant que vos données sont distribuées normalement, la règle empirique vous permet de prédire la vraisemblance que les résultats mesurés se situent dans certaines étendues. Si vous constatez que le pourcentage de résultats obtenus à différents écarts-types par rapport à la moyenne s'éloigne des pourcentages attendus décrits par la règle empirique, vous avez un indice précieux indiquant que quelque chose ne va peut-être pas.
Une présence conséquente de valeurs aberrantes au sein de vos données pourrait constituer une explication. Par exemple, si vos données correspondent aux mesures d'une spécification cible d'un produit manufacturé (une dimension en millimètres, par exemple), cela peut signifier que votre processus de fabrication est mal contrôlé et nécessite une attention particulière.
Sinon, cela peut s'expliquer par le fait que l'échantillon, pour diverses raisons, ne représente pas bien l'ensemble de la population, ou que la taille de l'échantillon est tout simplement trop petite.