Il quadro generale > Esplorazione dei dati su piattaforme multiple > Analisi dei valori simili nella piattaforma Clusterizzazione
Data di pubblicazione: 10/08/2021

Analisi dei valori simili nella piattaforma Clusterizzazione

La clusterizzazione è una tecnica multivariata che raggruppa osservazioni che condividono valori simili di un certo numero di variabili. La clusterizzazione gerarchica unisce righe in una sequenza gerarchica ritratta come un albero. I cereali con alcune caratteristiche, come quelli a elevato contenuto di fibre, sono raggruppati in cluster in modo da poter visualizzare le similarità tra di loro.

Nota: Per ulteriori informazioni sulla clusterizzazione gerarchica, consultare Multivariate Methods.

Scenario

Si desidera sapere quali cereali sono simili e quali non lo sono. L'analisi dei cluster dei dati sui cereali rivela le risposte alle seguenti domande:

Quale cluster di cereali presenta scarso valore nutrizionale?

Quale cluster di cereali ha un elevato contenuto di vitamine e minerali e una quantità ridotta di zuccheri e grassi?

Quale cluster di cereali ha un elevato contenuto di fibre e poche calorie?

Creazione del grafico dei cluster gerarchici

1. Con Cereal.jmp visualizzato, selezionare Analizza > Clusterizzazione > Cluster gerarchico.

2. Selezionare da Calories a Enriched, fare clic su Y, Colonne e quindi su OK.

Viene visualizzato il report Clusterizzazione gerarchica. I cluster sono colorati in base agli stati delle righe della tabella di dati.

Figura 6.11 Parte del report Clusterizzazione gerarchica 

Image shown here

3. Fare clic sul triangolo rosso associato a Clusterizzazione gerarchica e selezionare Colora cluster.

I cluster sono colorati in base alle loro relazioni nel dendrogramma.

Figura 6.12 Cluster colorati 

Image shown here

I cereali hanno caratteristiche simili all'interno di ogni cluster. Per esempio, considerando i nomi dei cereali nel cluster uno, si presume che i cereali abbiano un elevato contenuto di fibre.

Si noti come All-Bran with Extra Fiber e Fiber One siano raggruppati nel cluster uno. Questi cereali sono più simili tra loro rispetto agli altri due cereali nel cluster.

Figura 6.13 Cereali simili nel cluster uno 

Image shown here

4. Per selezionare il cluster uno, fare clic sulla linea orizzontale rossa a destra.

I quattro cereali sono evidenziati in rosso.

Figura 6.14 Selezione di un cluster 

Image shown here

5. Per vedere caratteristiche simili nel cluster, fare clic sul triangolo rosso associato a Clusterizzazione gerarchica e selezionare Riepilogo cluster.

Il grafico Riepilogo cluster in fondo al report mostra il valore medio di ogni variabile tra ogni cluster. Per esempio, i cereali in questo cluster contengono più fibre e potassio rispetto ai cereali negli altri cluster.

Figura 6.15 Riepilogo cluster 

Image shown here

6. Fare clic sul triangolo rosso associato a Clusterizzazione gerarchica e selezionare Matrice del grafico a dispersione.

Questa opzione è alternativa alla creazione di una matrice grafico a dispersione nella piattaforma Multivariato.

Si noti il grafico delle fibre nella riga Potassium. I cereali selezionati sono situati a destra del grafico tra 8 e 13 grammi. Questa posizione indica che i cereali nel cluster uno sono ricchi di fibre e potassio.

Figura 6.16 Caratteristiche del cluster uno 

Image shown here

Nota: i punti sono selezionati anche nella matrice grafico a dispersione precedentemente creata, se ancora aperta.

Interpretazione dei risultati

Facendo clic sui vari cluster e guardando il report Riepilogo cluster, è possibile individuare le seguenti caratteristiche:

I cereali del cluster uno, quali Fiber One e All-Bran, contengono una percentuale elevata di fibre e potassio e poche calorie.

I cereali del cluster due, che contiene molti dei cereali preferiti dai bambini, presentano molti zuccheri e poche fibre, carboidrati complessi e proteine.

I cereali del cluster tre (Puffed Rice e Puffed Wheat) hanno poche calorie ma offrono scarso valore nutritivo.

I cereali del cluster quattro, quali Total Corn Flakes e Multi-Grain Cheerios, offrono il 100% del fabbisogno giornaliero di vitamine e minerali. Hanno un ridotto contenuto di grassi, fibre e zuccheri.

I cereali del cluster cinque hanno un elevato contenuto di proteine e grassi e poco sodio. Il cluster è costituito da cereali quali Banana Nut Crunch e Quaker Oatmeal.

I cereali del cluster sei hanno un basso contenuto di grassi e un contenuto elevato di sodio e carboidrati. I cereali tradizionali quali Wheaties e Grape-Nuts sono in questo cluster.

I cereali del cluster sette presentano un contenuto elevato di calorie e poche fibre. Molti cereali contenenti frutta secca sono in questo cluster (Mueslix Healthy Choice, Low Fat Granola w Raisins, Oatmeal Raisin Crisp, Raisin Nut Bran e Just Right Fruit & Nut).

I cereali del cluster otto hanno un ridotto contenuto di sodio e zuccheri e un contenuto elevato di carboidrati complessi, proteine e potassio. I cereali Shredded Wheat e Mini-Wheat sono in questo cluster.

Guardando i join nel dendrogramma, è possibile vedere quali cereali in ogni cluster sono i più simili.

Nel cluster uno, Fiber One presenta un valore nutritivo simile a All-Bran with Extra Fiber. Anche 100% Bran e All-Bran sono simili. Ogni coppia di cereali simili è realizzata da diverse aziende, quindi i cereali sono in concorrenza.

Nel cluster due, Frosted Flakes e Honey Frosted Wheaties sono simili sebbene uno sia composto da fiocchi di mais e l'altro da fiocchi di frumento. Lucky Charms e Frosted Cheerios sono simili. Anche Cap’n’Crunch e Trix sono simili.

Conclusioni

Se si desidera assumere più fibre e meno calorie, si può decidere di provare i cereali nel cluster uno. È preferibile evitare i cereali del cluster tre, costituiti da grano e riso soffiato con scarso valore nutritivo. E si possono provare i cereali a elevato potere nutritivo del cluster quattro.

Vuoi maggiori informazioni? Hai domande? Ottieni risposte nella community di utenti JMP (community.jmp.com).