La regla empírica
¿Cuál es la regla empírica?
La regla empírica resume el porcentaje de datos de una distribución normal que caen dentro de una, dos o tres desviaciones estándar de la media.
¿Cuáles son los requisitos para utilizar la regla empírica?
Los datos deben tener una distribución normal.
Definición de la regla empírica
Cuando se tienen datos normales, la regla empírica permite comprenderlos rápidamente. Esta regla también se llama "regla del 68-95-99,7 %" o "regla de los tres sigmas". La regla describe el porcentaje de sus datos que se encuentra dentro de una, dos o tres desviaciones estándar de la media.
Esto es más fácil de entender si nos remitimos al gráfico de una distribución normal de la Figura 1. El centro del gráfico (cero en el eje x) representa la media de los datos. Las líneas verticales de puntos naranjas se trazan a una, dos y tres desviaciones estándar de la media.
Observe que aproximadamente el 68 % de los datos están dentro de una desviación estándar de la media. Recuerde que la distribución normal es una distribución teórica poblacional. La desviación estándar poblacional utiliza el símbolo s. A veces, verá esta regla escrita como "el 68 % de los datos están dentro de ±s de la media".
Del mismo modo, se puede observar que aproximadamente el 95 % de los datos se encuentran dentro de las dos desviaciones estándar de la media. Esto se suele escribir como "el 95 % de los datos están dentro de ±2s de la media".
Por último, aproximadamente el 99,7 % de los datos se encuentran dentro de tres desviaciones estándar de la media. Esto se escribe como "el 99,7 % de los datos están dentro de ±3s de la media".
En la práctica, rara vez conocerá la verdadera media o la desviación estándar de la población. En su lugar, realizará estimaciones utilizando la media y la desviación estándar de la muestra y, a continuación, utilizará esta regla.
Cómo utilizar la regla empírica
¿Cómo podría aplicar la regla empírica al analizar sus datos? Suponiendo que los datos se distribuyan normalmente, la regla empírica permite predecir la probabilidad de que los resultados medidos se sitúen dentro de determinados intervalos. Si comprueba que el porcentaje de resultados que se producen en varias desviaciones estándar de la media se desvía de los porcentajes esperados descritos por la regla empírica, sabrá que probablemente algo va mal.
Una explicación podría ser que tenga valores atípicos significativos en sus datos. Por ejemplo, si sus datos consisten en mediciones de una determinada especificación objetivo de un artículo fabricado (una dimensión en milímetros, por ejemplo), puede significar que su proceso de fabricación está mal controlado y necesita atención.
Otra explicación podría ser que la muestra, por diversas razones, no represente a la población en su conjunto, o que el tamaño muestral sea demasiado pequeño.