Il test del chi-quadrato

Che cos'è un test del chi-quadrato?

Il test del chi-quadrato è un metodo di verifica delle ipotesi. Due comuni test del chi-quadrato consistono nel verificare se le frequenze osservate in una o più categorie corrispondono alle frequenze attese.

Il test del chi-quadrato e il test del χ² sono la stessa cosa?

Sì, χ è la lettera greca chi.

Che opzioni ho?

Nel caso di una sola variabile di misura, si utilizza il test della bontà di adattamento del chi-quadrato. Se, invece, le variabili di misura sono due, si ricorre al test del chi-quadrato di indipendenza. Ce ne sono anche altri, ma questi due sono i più diffusi.

Tipi di test del chi-quadrato

Il test del chi-quadrato viene usato per verificare l'ipotesi che i dati corrispondano a quelli attesi. L'idea alla base del test è di confrontare i valori osservati nei dati e quelli attesi qualora l'ipotesi nulla fosse vera.

Sono due i test del chi-quadrato più usati: il test della bontà di adattamento del chi-quadrato e il test del chi-quadrato di indipendenza. Entrambi presentano delle variabili che dividono i dati in categorie. Di conseguenza, a volte si può essere confusi su quale utilizzare. La tabella riportata di seguito mette a confronto i due test.

Per esempi dettagliati con assunti e calcoli, vedere le pagine individuali di ciascun tipo di test del chi-quadrato.

Tabella 1: Scegliere un test del chi-quadrato

 

Test della bontà di adattamento del chi-quadrato

Test del chi-quadrato di indipendenza

Numero di variabiliUnaDue
Scopo del testStabilire la probabilità che una variabile derivi da una specifica distribuzioneStabilire se due variabili sono correlate
EsempioStabilire se i sacchetti di caramelle hanno lo stesso numero di pezzi per ogni gustoStabilire se l'acquisto di snack da parte degli spettatori è correlato al tipo di film visto
Esempi di ipotesi

Ho: la proporzione tra i gusti di caramelle è la stessa

Ha: la proporzione non è la stessa

Ho: la proporzione degli spettatori che acquistano snack non dipende dal tipo di film

Ha: la proporzione degli spettatori che acquistano snack varia in base al tipo di film

Distribuzione teorica usata nel testChi-quadratoChi-quadrato
DF (gradi di libertà)

Numero di categorie meno 1

  • Nel nostro esempio, il numero dei gusti di caramelle meno 1

Numero di categorie della prima variabile meno 1, moltiplicato per il numero di categorie della seconda variabile meno 1

  • Nel nostro esempio, il numero di categorie dei film meno 1, moltiplicato per 1 (perché l'acquisto di snack è una variabile sì/no e 2-1=1)

 

Come eseguire un test del chi-quadrato

Sia il test della bontà di adattamento del chi-quadrato che il test del chi-quadrato di indipendenza prevedono gli stessi passaggi di analisi, elencati di seguito. Per le procedure dettagliate, vedere le pagine relative a ciascun tipo di test.

  1. Definire l'ipotesi nulla e l'ipotesi alternativa prima di raccogliere i dati.
  2. Stabilire il valore alfa. Per farlo, bisogna determinare anche il rischio che si vuole correre di trarre le conclusioni sbagliate. Per esempio, in un test di indipendenza impostiamo α=0,05. In questo caso, il rischio di concludere che le due variabili siano indipendenti quando non lo sono sarà pari al 5 %.
  3. Verificare che non ci siano errori nei dati.
  4. Verificare gli assunti per il test (per ulteriori dettagli, vedere le pagine relative a ciascun tipo di test).
  5. Eseguire il test e trarre le conclusioni.


Entrambi i test del chi-quadrato nella tabella di cui sopra prevedono il calcolo della statistica di test. L'idea alla base dei test è di confrontare i valori di dati effettivi e quelli attesi qualora l'ipotesi nulla fosse vera. Per la statistica di test è necessario trovare la differenza quadratica tra i valori dei dati effettivi e attesi e dividerla per i valori dei dati attesi. Si ripete questa operazione per ciascun dato e si sommano i valori.

Poi si confronta la statistica di test con un valore teorico ripreso dalla distribuzione del chi-quadrato. Tale valore teorico dipende sia dal valore alfa che dai gradi di libertà dei dati. Per esempi dettagliati, vedere le pagine relative a ciascun tipo di test.