Grafico a barre
Che cos'è un grafico a barre?
Un grafico a barre mostra il conteggio dei valori per i livelli di una variabile categorica o nominale.
Come si usano i grafici a barre?
I grafici a barre sono utili per capire i livelli di una variabile e possono essere usati per verificare la presenza di errori.
Quali sono gli aspetti da considerare?
I grafici a barre si usano per i dati nominali o categorici. Per i dati continui è meglio usare gli istogrammi.
I grafici a barre mostrano le frequenze dei dati
I grafici a barre mostrano le frequenze dei valori per i diversi livelli di una variabile categorica o nominale. Talvolta, però, i grafici a barre mostrano altri indicatori statistici, come le percentuali. In Figura 1 è riportato un grafico a barre relativo alle risposte a un'indagine.
Le barre mostrano i livelli della variabile e la loro altezza rappresenta il conteggio delle risposte per quel livello.
Qual è la differenza tra grafici a barre e istogrammi?
Due differenze sostanziali tra istogrammi e grafici a barre sono rappresentate dagli spazi tra le barre e dalle tipologie di dati. Tra le barre degli istogrammi non ci sono spazi, al contrario dei grafici a barre. Tuttavia, in molti strumenti software è possibile modificare i grafici a barre in modo tale che tra le barre non ci siano spazi, il che ci porta alla seconda differenza sostanziale tra istogrammi e grafici a barre.
Gli istogrammi vengono utilizzati con dati continui, mentre i grafici a barre con dati categorici o nominali. Ulteriori informazioni sono disponibili nella sezione “Grafici a barre e tipi di dati”.
Qual è la differenza tra grafici a barre e diagrammi di Pareto?
Un diagramma di Pareto è un tipo speciale di grafico a barre in cui le barre sono ordinate dalla più alta alla più bassa. Diagrammi di questo tipo vengono spesso impiegati nel controllo qualità per individuare le aree più problematiche.
Così come per gli istogrammi, non ci sono spazi tra le barre dei diagrammi di Pareto. Tuttavia, diversamente dagli istogrammi, i diagrammi di Pareto riassumono conteggi relativi a variabili nominali o categoriche.
La Figura 2 offre un esempio di diagramma di Pareto in cui sono riassunti i tipi di elementi rilevati durante l'audit di processi aziendali. Il grafico comprende una legenda delle categorie che permette di utilizzare etichette più lunghe, facilitando la lettura delle categorie.
Grafici con indicatori statistici diversi dai conteggi
Nonostante tutti gli esempi riportati mostrino grafici a barre relativi a conteggi, gli stessi grafici possono rappresentare anche altre tipologie di indicatori statistici, come le percentuali. La maggior parte degli strumenti software permette di scegliere quali indicatori statistici rappresentare.
Esempi di grafici a barre
I grafici a barre vengono spesso realizzati tramite software. Solitamente, i software permettono agli utenti di creare grafici a barre orizzontali e verticali e di aggiungere caratteristiche personalizzate.
Di seguito sono riportati alcuni esempi di grafici a barre. Per stabilire quale sia il grafico a barre migliore per rappresentare un certo set di dati, consigliamo di consultare uno statistico o i numerosi libri e siti web a disposizione.
Le Figure da 3 a 15 riportano i dati relativi a 10 sacchetti di caramelle. Ogni sacchetto contiene 100 caramelle e per ognuno è stato conteggiato il numero di caramelle dei cinque gusti disponibili. Lo scopo è quello di ottenere sacchetti in cui i gusti sono suddivisi più o meno equamente e, pertanto, di avere circa 20 caramelle di ogni gusto in ciascun sacchetto. Su 10 sacchetti, il numero atteso di caramelle di ogni gusto è di circa 200.
Il primo passo è creare un grafico a barre con i dati, come mostrato in Figura 3:
Il software posiziona le barre secondo l'ordine alfabetico dei nomi dei gusti, il che potrebbe essere il modo migliore per mostrare i risultati al pubblico.
Volendo, si possono posizionare le barre secondo l'ordine decrescente dei conteggi, come mostrato in Figura 4:
Ora è evidente che i conteggi totali delle caramelle al gusto uva e di quelle al gusto arancia sono uguali. Era così anche in Figura 3, ma non era facilmente individuabile.
Le barre sono verticali. Nel caso di etichette lunghe, si consiglia di utilizzare un grafico a barre orizzontale. La Figura 5 mostra gli stessi dati con etichette più lunghe per i gusti in un grafico orizzontale. Se avessimo usato un grafico verticale, la lettura delle etichette sarebbe stata meno agevole.
In questi esempi abbiamo usato lo stesso colore per tutte le barre. In genere, l'uso di molti colori rende più difficile la comprensione di un grafico.
Supponiamo che lo stabilimento dolciario richieda che ogni sacchetto contenga almeno 18 pezzi per ogni gusto. Per 10 sacchetti, sono necessari almeno 180 pezzi per ogni gusto. Dai dati emerge che ci sono solo 120 caramelle alla ciliegia e vogliamo evidenziare questo problema. La Figura 6 utilizza una barra ombreggiata a questo scopo. Alternativamente, si può usare un colore diverso per evidenziare la barra del gusto ciliegia.
Volendo, è possibile aggiungere etichette alle barre. In Figura 7, all'estremità di ogni barra è stato aggiunto il relativo conteggio. In questo modo è possibile segnalare eventuali problemi con il gusto alla mela rossa caramellata, in quanto soddisfa appena il requisito di 18 caramelle per sacchetto.
In che modo i valori di dati estremi influiscono sui grafici a barre
I grafici a barre mostrano i conteggi delle categorie nei dati e, a differenza degli istogrammi, non sono influenzati dai valori estremi. Tali grafici mostrano semplicemente un'altra barra di categoria con un numero molto elevato (o molto ridotto) di valori. La Figura 8 rappresenta un altro set di dati relativi alle caramelle, in cui il gusto uva è stato sostituito dal mango. Il conteggio del gusto mango è molto più basso del previsto.
La Figura 9 mostra un altro esempio, in cui il gusto Uva è stato sostituito dal gusto Ananas. Il conteggio del gusto Ananas è molto più alto del previsto.
I grafici a barre possono aiutare a identificare i valori errati all'interno dei dati. Nella Figura 10, in un'occorrenza, “Mango” è stato digitato in modo errato (“Mangi”) ed è un errore evidente nei dati che deve essere corretto. I grafici a barre possono essere utili per trovare errori nei dati.
Come si aggiungono i gruppi ai grafici a barre?
Nel caso di dati contenenti gruppi, la rappresentazione di tutti i dati insieme in un grafico a barre può contribuire all'identificazione di pattern. La Figura 11 unisce i dati relativi a tre stabilimenti dolciari.
Questa figura mostra quali stabilimenti inseriscono un certo tipo di gusto nei sacchetti di caramelle. Inoltre, permette di individuare i problemi, come il numero insufficiente di caramelle al Mango nei sacchetti dello Stabilimento A. Ai fini di questo esempio, è opportuno disporre le barre in ordine alfabetico. Non è possibile ordinare per conteggio in quanto l'ordine varierebbe a seconda dello stabilimento.
Ai fini di questo esempio, può essere utile applicare un colore diverso a ogni stabilimento, come mostrato in Figura 12.
Volendo, è possibile mostrare i conteggi sull'asse orizzontale per semplificare il confronto visivo, come mostrato in Figura 13.
Se la Figura 13 aiuta a confrontare i conteggi dei diversi gusti, rende però più difficile capire quali gusti vengono dai diversi stabilimenti, rispetto alla Figura 12.
Questi sono solo alcuni dei tanti modi per aggiungere gruppi ai grafici a barre. A seconda del caso, bisogna pensare quale messaggio si vuole far arrivare al pubblico e quale è il grafico più adatto per trasmetterlo.
Grafici a barre impilate
Invece di usare i gruppi, si possono usare i grafici a barre impilate. Con un grafico a barre impilate si possono mostrare le risposte per più gruppi, corrispondenti agli stabilimenti di produzione delle caramelle. A ogni gruppo corrisponde una barra. I conteggi di frequenza della variabile vengono poi impilati sulla barra corrispondente al relativo stabilimento. Nel caso dei dati delle caramelle, i conteggi dei diversi gusti risulteranno impilati sulle barre dei vari stabilimenti. La Figura 14 mostra un grafico a barre impilate dei dati delle caramelle da tre stabilimenti, utilizzando un colore diverso per ogni gusto.
Nella Figura 14, è facile osservare che solo lo Stabilimento A utilizza il Mango, solo lo Stabilimento B utilizza l'Ananas e solo lo Stabilimento C utilizza l'Uva. Confrontando le dimensioni delle sezioni impilate delle barre, possiamo inoltre notare come lo Stabilimento A utilizzi pochissime caramelle al Mango, mentre lo Stabilimento B ne usa molte all'Ananas.
Nei grafici a barre impilate è importante inserire una legenda. Molti strumenti software consentono di aggiungere etichette a un grafico a barre impilate, come si vede in Figura 15. Per esempio, le etichette ci aiutano a capire che, per lo Stabilimento B, i conteggi dei gusti Ciliegia e Arancia sono uguali.
Prima di prendere una decisione definitiva sulla base dei colori di un grafico a barre impilate, può essere utile stamparlo in scala di grigi. Inoltre, come mostrato in Figura 15, quando vengono aggiunte etichette, bisogna assicurarsi che rimangano leggibili e non si confondano con il colore di sfondo di ciascun elemento della barra impilata.
Grafici a barre e tipi di dati
Le Figure da 16 a 20 illustrano quando è opportuno utilizzare grafici a barre o istogrammi per diverse tipologie di dati.
Dati categorici o nominali e grafici a barre
I grafici a barre sono adatti per rappresentare i dati categorici o nominali, perché si tratta di dati misurati su una scala con valori potenziali specifici.
Nel caso di dati categorici, spesso il campione viene diviso in gruppi e le risposte hanno un ordine ben definito. Per esempio, in un sondaggio in cui viene chiesto di dare la propria opinione su una scala da “Per niente d'accordo” a “Molto d'accordo” le risposte sono categoriche.
Nel caso di dati nominali, il campione è sempre diviso in gruppi, che però non seguono un ordine particolare. Un esempio di variabile nominale è il paese di residenza. La codifica può essere la sigla del nome del paese oppure un numero, ma in ogni caso si tratta solo di attribuire un nome a gruppi di dati diversi.
Dati continui e istogrammi
I grafici a barre non sono ideali per rappresentare i dati continui, perché si tratta di dati misurati su scale con molti valori possibili. Esempi di dati continui:
- Età
- Pressione sanguigna
- Peso
- Temperatura
- Velocità
Fer tutti questi esempi, meglio usare gli istogrammi invece dei grafici a barre.