Il test t
Che cos'è un test t?
Il test t (noto anche come test t di Student) è uno strumento per valutare le medie di una o due popolazioni tramite verifica d'ipotesi. Il test t può essere usato per determinare se un singolo gruppo differisce da un valore conosciuto (test t a un campione), se due gruppi differiscono l'uno dall'altro (test t a due campioni indipendenti), o se c'è una differenza significativa nelle misure appaiate (test t a campioni dipendenti, o appaiati).
Come si usano i test t?
Prima di tutto, si definisce l'ipotesi da verificare e si determina un rischio accettabile di trarre una conclusione sbagliata. Ad esempio, nel caso di un confronto tra due popolazioni si può ipotizzare che le loro medie siano le stesse e si decide una probabilità accettabile di giungere alla conclusione che vi sia una differenza quando non è così. Poi, si calcola una statistica di test a partire dai dati e la si confronta con un valore teorico ripreso da una distribuzione t. A seconda del risultato, si rifiuta o non si rifiuta l'ipotesi nulla.
E se ci sono più di due gruppi?
Non si può usare un test t. In questo caso è meglio usare un metodo di confronto multiplo, come per esempio l'analisi della varianza (ANOVA), il confronto appaiato di Tukey-Kramer, il confronto di Dunnett con controllo e l'analisi delle medie (ANOM).
Assunti del test t
Anche se questo tipo di test difficilmente devia dagli assunti, gli assunti dei test t sono i seguenti:
- I dati sono continui.
- I dati di esempio si riferiscono a un campione casuale della popolazione.
- Vi è omogeneità nella varianza (la variabilità dei dati di ciascun gruppo è simile).
- La distribuzione è approssimativamente normale.
In caso di test t a due campioni, i campioni devono essere indipendenti. In caso contrario, è più adatto un test t appaiato.
Tipi di test t
Esistono tre tipi di test t per il confronto delle medie: il test t a un campione, il test t a due campioni e il test t appaiato. La tabella che segue riassume le caratteristiche di ognuno, con informazioni su come scegliere il test più adatto. Per esempi dettagliati con assunti e calcoli, vedere le pagine individuali di ciascun tipo di test t.
Test t a un campione | Test t a due campioni | Test t appaiato | |
---|---|---|---|
Sinonimi | Test t di Student |
|
|
Numero di variabili | Una | Due | Due |
Tipo di variabile |
|
|
|
Scopo del test | Valutare se la media della popolazione corrisponde a un valore specifico | Valutare se le medie delle popolazioni di due gruppi diversi sono uguali | Valutare se la differenza tra le misure appaiate di una popolazione è pari a zero |
Esempio: valutare se... | La frequenza cardiaca media di un gruppo di persone è uguale a 65 | Le frequenze cardiache medie di due gruppi di persone sono uguali | La differenza media nelle frequenze cardiache di un gruppo di persone prima e dopo l'esercizio fisico è pari a zero |
Stima della media di una popolazione | Media del campione | Media del campione di ogni gruppo | Media delle differenze delle misure appaiate del campione |
Deviazione standard della popolazione | Sconosciuta, utilizzare deviazione standard del campione | Sconosciuta, utilizzare deviazioni standard del campione per ogni gruppo | Sconosciuta, utilizzare deviazione standard delle differenze nelle misure appaiate |
DF (gradi di libertà) | Numero di osservazioni nel campione meno uno, oppure: n–1 | Somma delle osservazioni in ogni campione meno 2, oppure: n1 + n2 – 2 | Numero di osservazioni appaiate nel campione meno uno, oppure: n–1 |
La tabella qui sopra mostra solo i test t per le medie delle popolazioni. Un altro test t di comune utilizzo è quello per i coefficienti di correlazione. Questo test t viene impiegato per decidere se il coefficiente di correlazione è significativamente diverso da zero.
Test a una coda o a due code
Nel definire un'ipotesi, si stabilisce anche se si tratta di un test a una o a due code. La decisione va presa prima di raccogliere i dati o di iniziare con i calcoli e va applicata a tutti e tre i test t per le medie.
Per maggiore chiarezza, vediamo il test t a un campione. Poniamo di avere un campione casuale di barrette proteiche e che l'etichetta nutrizionale dica che ognuna contiene 20 grammi di proteine. L'ipotesi nulla è che la media sconosciuta della popolazione sia pari a 20. Poniamo di voler semplicemente sapere se i dati mostrano una media della popolazione diversa. In questa situazione, le ipotesi sono:
$ \mathrm H_o: \mu = 20 $
$ \mathrm H_a: \mu \neq 20 $
Pertanto, abbiamo un test a due code. I dati ci serviranno a vedere se la media del campione presenta variazioni significative da 20 (più alte o più basse) e se si può concludere che la media sconosciuta della popolazione sia diversa da 20.
Poniamo invece di voler scoprire se quanto riportato sull'etichetta nutrizionale è corretto. I dati supportano l'idea che la media sconosciuta della popolazione sia uguale a 20 oppure no? In questa situazione, le ipotesi sono:
$ \mathrm H_o: \mu >= 20 $
$ \mathrm H_a: \mu < 20 $
In questo caso, abbiamo un test a una coda. I dati ci serviranno a vedere se la media del campione è inferiore a 20 tanto da rifiutare l'ipotesi che la media sconosciuta della popolazione sia 20 o più.
La sezione "code per test a ipotesi" sulla pagina distribuzione t riporta diverse immagini che illustrano i concetti di test a una o a due code.
Come effettuare un test t
Tutti i test t che hanno a che fare con delle medie prevedono gli stessi passaggi:
- Definire l'ipotesi nulla ($ \mathrm H_o $) e l'ipotesi alternativa ($ \mathrm H_a $) prima di raccogliere i dati.
- Stabilire il valore alfa (o valore α). Per farlo, bisogna determinare anche il rischio che si vuole correre di trarre le conclusioni sbagliate. Per esempio, poniamo di confrontare due gruppi indipendenti impostando α=0,05. In questo caso, il rischio di concludere che le due medie sconosciute della popolazione siano diverse quando non lo sono sarà pari al 5 %.
- Verificare che non ci siano errori nei dati.
- Verificare gli assunti per il test
- Eseguire il test e trarre le conclusioni. Tutti i test t per le medie comportano il calcolo della statistica di test. Confrontare la statistica di test con un valore teorico ripreso dalla distribuzione t. Tale valore teorico riprende sia il valore α che i gradi di libertà dei dati. Per maggiori dettagli, vedere le pagine dei test t a un campione, test t a due campioni e test t appaiati.