Z-Score
Cos'è un punteggio z?
Un punteggio z è una misura standardizzata della distanza di un particolare valore di dati dalla media di un set di dati distribuito normalmente.
Come vengono utilizzati i punteggi z?
Fornendo una scala uniforme per esprimere l'estremo di un dato punto di dati rispetto alla media, i punteggi z sono utili per identificare i valori anomali e per confrontare dati provenienti da distribuzioni diverse. Un punteggio z è anche un modo rapido per applicare la regola empirica. Ad esempio, puoi verificare rapidamente se il 95% dei valori in un set di dati rientra in due deviazioni standard controllando la percentuale di valori con punteggi z compresi tra -2 e 2.
Come si calcolano i punteggi z?
Il punteggio z viene calcolato sottraendo la media da un valore di dati e quindi dividendo per la deviazione standard.
Utilizzare il punteggio z
Scopri come calcolare i punteggi z utilizzando un software statistico
- Scarica JMP per seguire le spiegazioni con i dati di esempio inclusi nel software.
- Per vedere altri tutorial JMP, visita la Libreria di apprendimento di JMP.
Un punteggio z è un modo per misurare la distanza dalla media di ciascuno dei valori dei dati utilizzando una scala standardizzata. I punteggi z convertono i tuoi dati grezzi in dati da una distribuzione z. La distribuzione z è una distribuzione normale con media 0 e deviazione standard 1. Viene spesso chiamata distribuzione normale standard.
Perché convertire i punteggi in z?
La conversione in un punteggio z semplifica l'applicazione della regola empirica. Ad esempio, poiché la deviazione standard della distribuzione z è 1, sai che circa il 95% dei valori è compreso tra -2 e +2.
La conversione in punteggi z ci permette di valutare la distanza dalla media su una scala standardizzata. Prima della diffusione dei computer, i libri di testo di statistica contenevano tabelle di distribuzione normale standardizzata, che consentivano agli studenti di cercare distanze dalla media più precise rispetto a una, due e tre deviazioni standard della regola empirica.
Come convertire i punteggi in z
Per convertire un valore di dati, sottrarre la media dal valore e poi dividere per la deviazione standard. Il risultato è chiamato "punteggio z" o "punteggio standardizzato". In teoria, si utilizza la media e la deviazione standard della popolazione. In pratica, di solito si utilizzano la media e la deviazione standard del campione.
Questo è più facile da capire con un esempio.
Per un semplice esempio, utilizzeremo solo alcuni valori di dati. Supponiamo di misurare la frequenza cardiaca. La maggior parte delle persone ha una frequenza cardiaca compresa tra 60 e 100 battiti al minuto (BPM). Supponiamo che i valori dei dati siano:
55 |
60 |
65 |
75 |
80 |
85 |
La media di questi valori è 70 e la deviazione standard è 11,8. (Puoi vedere come eseguire questi calcoli nelle pagine sulla media e la deviazione standard.)
Supponiamo che ti venga chiesto se il valore di 55 è compreso tra due deviazioni standard. Puoi capirlo usando la media e la deviazione standard per calcolare il valore che è distante due deviazioni standard da 70. Quel calcolo è come segue:
70 – (2 x 11,8) = 70 – 23,6 = 46,4
Poiché 55 è compreso nell'intervallo da 46,4 a 70, 55 si trova entro due deviazioni standard dalla media.
In alternativa, si può calcolare il punteggio z. Ricorda che per calcolare il punteggio z per un insieme di valori, devi semplicemente sottrarre la media da ciascun valore e dividerla per la deviazione standard. Ecco i punteggi z per le misurazioni della frequenza cardiaca:
Dati | Z-Score |
55 | (55 – 70) / 11,8 = –1,27 |
60 | (60 – 70) / 11,8 = –0,85 |
65 | (65 – 70) / 11,8 = –0,42 |
75 | (75 – 70) / 11,8 = 0,42 |
80 | (80 – 70) / 11,8 = 0,85 |
85 | (85 – 70) / 11,8 = 1,27 |
Ora, possiamo vedere che il valore di 55 rientra in due deviazioni standard. In effetti, è 1,27 deviazioni standard sotto la media.
Abbiamo utilizzato la media campionaria e la deviazione standard campionaria per calcolare i nostri punteggi z, che è una pratica tipica, anche se la teoria statistica si basa sulla media della popolazione e sulla deviazione standard della popolazione.