Il test del chi-quadrato

Che cos'è un test del chi-quadrato?

Il test del chi-quadrato è un metodo di verifica delle ipotesi. Due comuni test del chi-quadrato consistono nel verificare se le frequenze osservate in una o più categorie corrispondono alle frequenze attese.

Il test del chi-quadrato e il test del χ² sono la stessa cosa?

Sì, χ è la lettera greca chi.

Che opzioni ho?

Nel caso di una sola variabile di misura, si utilizza il test della bontà di adattamento del chi-quadrato. Se, invece, le variabili di misura sono due, si ricorre al test del chi-quadrato di indipendenza. Ce ne sono anche altri, ma questi due sono i più diffusi.

Tipi di test del chi-quadrato

Il test del chi-quadrato viene usato per verificare l'ipotesi che i dati corrispondano a quelli attesi. L'idea alla base del test è di confrontare i valori osservati nei dati e quelli attesi qualora l'ipotesi nulla fosse vera.

Sono due i test del chi-quadrato più usati: il test della bontà di adattamento del chi-quadrato e il test del chi-quadrato di indipendenza. Entrambi presentano delle variabili che dividono i dati in categorie. Di conseguenza, a volte si può essere confusi su quale utilizzare. La tabella riportata di seguito mette a confronto i due test.

Per esempi dettagliati con assunti e calcoli, vedere le pagine individuali di ciascun tipo di test del chi-quadrato.

Tabella 1: Scegliere un test del chi-quadrato

Test della bontà di adattamento del chi-quadrato

Test del chi-quadrato di indipendenza

Numero di variabili

Una

Due

Scopo del test

Stabilire la probabilità che una variabile derivi da una specifica distribuzione

Stabilire se due variabili sono correlate

Esempio

Stabilire se i sacchetti di caramelle hanno lo stesso numero di pezzi per ogni gusto

Stabilire se l'acquisto di snack da parte degli spettatori è correlato al tipo di film visto

Esempi di ipotesi

Ho: la proporzione tra i gusti di caramelle è la stessa

Ha: la proporzione non è la stessa

Ho: la proporzione degli spettatori che acquistano snack non dipende dal tipo di film

Ha: la proporzione degli spettatori che acquistano snack varia in base al tipo di film

Distribuzione teorica usata nel test

Chi-quadrato

Chi-quadrato

DF (gradi di libertà)

Numero di categorie meno 1

  • Nel nostro esempio, il numero dei gusti di caramelle meno 1

Numero di categorie della prima variabile meno 1, moltiplicato per il numero di categorie della seconda variabile meno 1

  • Nel nostro esempio, il numero di categorie dei film meno 1, moltiplicato per 1 (perché l'acquisto di snack è una variabile sì/no e 2-1=1)

Come eseguire un test del chi-quadrato

Sia il test della bontà di adattamento del chi-quadrato che il test del chi-quadrato di indipendenza prevedono gli stessi passaggi di analisi, elencati di seguito. Per le procedure dettagliate, vedere le pagine relative a ciascun tipo di test.

  1. Definire l'ipotesi nulla e l'ipotesi alternativa prima di raccogliere i dati.
  2. Stabilire il valore alfa. Per farlo, bisogna determinare anche il rischio che si vuole correre di trarre le conclusioni sbagliate. Per esempio, in un test di indipendenza impostiamo α=0,05. In questo caso, il rischio di concludere che le due variabili siano indipendenti quando non lo sono sarà pari al 5 %.
  3. Verificare che non ci siano errori nei dati.
  4. Verificare gli assunti per il test (per ulteriori dettagli, vedere le pagine relative a ciascun tipo di test).
  5. Eseguire il test e trarre le conclusioni.

Entrambi i test del chi-quadrato nella tabella di cui sopra prevedono il calcolo della statistica di test. L'idea alla base dei test è di confrontare i valori di dati effettivi e quelli attesi qualora l'ipotesi nulla fosse vera. Per la statistica di test è necessario trovare la differenza quadratica tra i valori dei dati effettivi e attesi e dividerla per i valori dei dati attesi. Si ripete questa operazione per ciascun dato e si sommano i valori.

Poi si confronta la statistica di test con un valore teorico ripreso dalla distribuzione del chi-quadrato. Tale valore teorico dipende sia dal valore alfa che dai gradi di libertà dei dati. Per esempi dettagliati, vedere le pagine relative a ciascun tipo di test.