Diagramma a mosaico
Cos'è un diagramma a mosaico?
Un diagramma a mosaico è un particolare tipo di grafico a barre impilate, che mostra le percentuali di dati in un certo gruppo. In sostanza, è una rappresentazione grafica di una tabella di contingenza.
Come viene usato?
I diagrammi a mosaico mostrano le relazioni tra elementi, al fine di consentire un confronto visivo tra gruppi.
I diagrammi a mosaico mostrano le relazioni tra elementi
Un diagramma a mosaico è un particolare tipo di grafico a barre impilate. Nel caso di due variabili, la larghezza delle colonne è proporzionale al numero di osservazioni per ciascun livello della variabile inserita sull'asse orizzontale. L'altezza delle barre in verticale, invece, è proporzionale al numero di osservazioni della seconda variabile per ciascun livello della prima variabile.
I diagrammi a mosaico, quindi, servono a mostrare i rapporti tra elementi e costituiscono una maniera visiva di fare confronti tra gruppi. La Figura 1 mostra un diagramma a mosaico dei dati di uno studio clinico. L'obiettivo è confrontare la distribuzione dei pazienti sopra i 65 anni nel gruppo a cui viene somministrato il farmaco in studio e in quello placebo. Idealmente, uno studio clinico dovrebbe avere la stessa percentuale di pazienti anziani in entrambi i gruppi.
Il diagramma a mosaico della Figura 1 mostra che nel gruppo placebo c'è una percentuale maggiore di pazienti anziani rispetto al gruppo a cui è stato somministrato il farmaco in studio. Il team che conduce l'esperimento deve decidere se le percentuali sono “abbastanza vicine” all'obiettivo o meno. Dal diagramma emerge anche che c'è una percentuale complessiva minore di pazienti anziani.
Esempi di diagrammi a mosaico
Esempio 1: aggiungere le etichette
La Figura 2 espande l'esempio di base aggiungendo le etichette al diagramma a mosaico.
Notiamo ora una differenza di circa il 10 % nella percentuale dei pazienti anziani nel gruppo placebo e in quello a cui è stato somministrato il farmaco in studio. Per valutare se tale differenza è significativa o meno, possiamo ricorrere a un test del chi-quadrato di indipendenza.
L'aggiunta di etichette a un diagramma a mosaico ha senso solo se ci sono poche celle. Quando ce ne sono molte, è possibile che le celle più piccole non vengano etichettate. Nel caso di un set di dati di piccole dimensioni, si consiglia di usare le etichette dei conteggi al posto delle percentuali per specificare che la visualizzazione si basa su informazioni limitate.
Esempio n. 2: Due variabili delle categorie
I diagrammi a mosaico possono essere estesi a più di due variabili. Il grafico in Figura 3 mostra le percentuali di sopravvivenza dei passeggeri del Titanic. Le categorie sono formate dalle combinazioni dei livelli della classe del biglietto e del sesso dei passeggeri.
Esempio 3: percentuali sull'asse delle x
I diagrammi a mosaico mostrano le percentuali sull'asse delle x. La figura 4 mostra i dati relativi agli allievi delle scuole urbane e rurali. Agli studenti è stato chiesto se il loro obiettivo principale fosse di avere buoni voti, riuscire nello sport o essere popolari.
Il diagramma a mosaico mostra che gli obiettivi degli studenti nelle zone urbane e periferiche sono molto simili tra loro, con percentuali molto vicine. Al contrario, gli studenti delle zone rurali hanno obiettivi diversi e sono suddivisi quasi uniformemente sui tre obiettivi. In alternativa, è possibile etichettare il diagramma a mosaico con i conteggi.
Esempio 4: usare il criterio di ordinamento
A volte i diagrammi a mosaico hanno un criterio di ordinamento naturale a causa delle relative categorie. Si veda l'esempio 2, con i dati dei sopravvissuti alla tragedia del Titanic.
Se il diagramma a mosaico non ha un suo ordine naturale, può essere difficile usarlo per confronti visivi. Il grafico in figura 5 mostra la distribuzione delle sedi di produzione di diverse categorie di veicoli.
Vediamo che tutte le auto di grandi dimensioni sono statunitensi, ma è difficile confrontare le percentuali delle auto compatte e di medie dimensioni prodotte negli Stati Uniti.
Per migliorare il diagramma a mosaico, possiamo disporre le categorie di veicoli secondo l'ordine crescente della percentuale prodotta negli Stati Uniti. La Figura 6 mostra il diagramma a mosaico modificato. In questo modo, è più semplice confrontare i due gruppi.
In questo modo possiamo notare che negli Stati Uniti sono prodotte più auto compatte che auto di dimensioni medie. Inoltre, il diagramma ordinato indica che tutte le auto grandi sono prodotte negli Stati Uniti.