La regola empirica

Cos'è la regola empirica?

La regola empirica riassume la percentuale di dati di una distribuzione normale che rientra in una, due o tre deviazioni standard della media.

Quali sono i requisiti per utilizzare la regola empirica?

I tuoi dati devono essere distribuiti normalmente.

Definizione della regola empirica

Quando si dispone di dati normali, la regola empirica consente di comprenderli rapidamente. ed è chiamata anche "regola del 68-95-99,7%" o la "regola dei tre sigma". La regola descrive la percentuale dei dati che si trova entro una, due o tre deviazioni standard dalla media.

Questo è più facile da capire facendo riferimento al grafico di una distribuzione normale nella Figura 1. Il centro del grafico, zero sull'asse x, rappresenta la media dei dati. Le linee verticali arancioni punteggiate sono tracciate a una, due e tre deviazioni standard dalla media.

Nota che circa il 68% dei dati rientra in una deviazione standard della media. Ricorda che la distribuzione normale è una distribuzione teorica della popolazione. La deviazione standard della popolazione utilizza il simbolo s.A volte questa regola viene scritta come "il 68% dei dati è compreso entro ±s dalla media". 

Allo stesso modo, puoi vedere che circa il 95% dei dati rientra entro due deviazioni standard della media. Questo viene spesso scritto come "il 95% dei dati è compreso entro ±2s dalla media".

Infine, circa il 99,7% dei dati si trova entro tre deviazioni standard dalla media. Questo è spesso scritto come "il 99,7% dei dati è compreso entro ±3s dalla media".

In pratica, raramente conoscerai la vera media della popolazione o la deviazione standard della popolazione. Invece, effettuerai una stima utilizzando la media campionaria e la deviazione standard del campione e quindi utilizzerai questa regola. 

Figura 1: grafico di una distribuzione normale

Come usare la regola empirica

Come puoi applicare la regola empirica nell'analisi dei tuoi dati? Supponendo che i dati siano distribuiti normalmente, la regola empirica consente di prevedere la probabilità che i risultati misurati rientrino in determinati intervalli. Se scopri che una certa percentuale di risultati che si verificano a varie deviazioni standard dalla media si discosta dalle percentuali previste descritte dalla regola empirica, avrai un prezioso suggerimento che ti dice che qualcosa potrebbe non andare.

Una spiegazione potrebbe essere la presenza di valori anomali significativi nei dati. Ad esempio, se i dati sono costituiti da misurazioni di una determinata specifica target di un articolo prodotto, ad esempio una dimensione in millimetri, può significare che il processo di produzione è scarsamente controllato e richiede attenzione.

Un'altra spiegazione potrebbe essere che il campione, per vari motivi, è una scarsa rappresentazione della popolazione più ampia o che la dimensione del campione è semplicemente troppo piccola.