Das große Ganze > Beispiel für die Untersuchung von Daten in mehreren Plattformen > Ähnliche Werte in der Plattform „Clustern“ analysieren
Erscheinungsdatum: 08/11/2023

Ähnliche Werte in der Plattform „Clustern“ analysieren

Clustern ist eine multivariate Technik, bei der Beobachtungen mit ähnlichen Werten über eine Anzahl von Variablen zusammen gruppiert werden. Beim hierarchischen Clustern werden Zeilen in einer hierarchischen Folge miteinander verbunden, die als Baum dargestellt wird. Im Cerealienbeispiel sehen Sie, dass Cerealien mit bestimmten Eigenschaften, wie einem hohen Ballaststoffanteil, in Clustern gruppiert werden, so dass Sie Ähnlichkeiten unter den Cerealienprodukten anzeigen können.

Hinweis: Weitere Informationen zum hierarchischen Clustern finden Sie unter Multivariate Methods.

Szenario

Sie möchten wissen, welche Cerealien einander ähnlich sind und welche sich nicht ähnlich sind. Die Analyse von Clustern von Cerealiendaten liefert Antworten auf die folgenden Fragen:

Welche Cluster von Cerealien bieten einen geringen Nährwert?

Welche Cluster von Cerealien sind reich an Vitaminen und Mineralien und enthalten wenig Zucker und Fett?

Welche Cluster von Cerealien haben einen hohen Ballaststoffanteil und einen geringen Kaloriengehalt?

Graphen für hierarchisches Clustern erstellen

1. Wählen Sie, wenn Cereal.jmp angezeigt wird, Analysieren > Clustern > Hierarchisches Cluster.

2. Wählen Sie Calories bis Enriched aus, klicken Sie auf Y, Spalten und dann auf OK.

Der Bericht „Hierarchisches Clustern“ wird angezeigt. Die Cluster sind entsprechend den Zeileneigenschaften in der Datentabelle farblich markiert.

Abbildung 6.11 Teil des Berichts „Hierarchisches Clustern“ 

Portion of the Hierarchical Clustering Report

3. Klicken Sie auf das rote Dreieck für „Hierarchisches Clustern“ und wählen Sie Cluster färben aus.

Die Cluster werden entsprechend ihrer Beziehungen im Dendrogramm farblich gekennzeichnet.

Abbildung 6.12 Farblich gekennzeichnete Cluster 

Colored Clusters

Die Cerealien innerhalb eines jeden Clusters haben ähnliche Eigenschaften. So vermuten Sie beispielsweise anhand der Namen der Cerealienprodukte in Cluster eins, dass die Cerealien einen hohen Ballaststoffanteil aufweisen.

Beachten Sie, dass All-Bran with Extra Fiber und Fiber One in Cluster eins gruppiert sind. Diese Cerealien ähneln einander stärker als die beiden anderen Cerealien in dem Cluster.

Abbildung 6.13 Ähnliche Cerealien in Cluster eins 

Similar Cereals in Cluster One

4. Um Cluster eins auszuwählen, klicken Sie rechts auf die rote horizontale Linie.

Die vier Cerealienprodukte werden rot hervorgehoben.

Abbildung 6.14 Cluster auswählen 

Selecting a Cluster

5. Um die ähnlichen Eigenschaften im Cluster anzuzeigen, klicken Sie auf das rote Dreieck für „Hierarchisches Clustern“ und wählen Clusterzusammenfassung aus.

Der Graph mit der Clusterzusammenfassung im unteren Bereich des Berichts zeigt den Mittelwert jeder Variable in jedem Cluster. So enthalten die Cerealien in diesem Cluster beispielsweise mehr Ballaststoffe und Kalium als die Cerealien in anderen Clustern.

Abbildung 6.15 Clusterzusammenfassung 

Cluster Summary

6. Klicken Sie auf das rote Dreieck für „Hierarchisches Clustern“ und wählen Sie Streudiagramm-Matrix aus.

Diese Option ist eine Alternative zum Erstellen einer Streudiagrammmatrix in der Plattform „Multivariat“.

Beachten Sie das Fiber-Diagramm in der Zeile „Potassium“. Die ausgewählten Cerealien befinden sich auf der rechten Seite des Diagramms zwischen 8 und 13 Gramm. Diese Stelle deutet darauf hin, dass die Cerealien in Cluster eins einen hohen Ballaststoff- und Kaliumanteil haben.

Abbildung 6.16 Eigenschaften von Cluster eins 

Cluster One Characteristics

Hinweis: Die Punkte werden auch in der von Ihnen zuvor erstellten Streudiagrammmatrix ausgewählt, sofern diese noch geöffnet ist.

Ergebnisse interpretieren

Wenn Sie durch die Cluster klicken und den Clusterzusammenfassungsbericht betrachten, erkennen Sie die folgenden Eigenschaften:

Cerealien in Cluster eins, wie Fiber One und All-Bran, haben einen hohen Ballaststoff- und Kaliumgehalt und wenig Kalorien.

Die bei Kindern beliebten Cerealienprodukte in Cluster zwei enthalten viel Zucker und wenig Ballaststoffe, komplexe Kohlenhydrate und Protein.

Cerealien in Cluster drei (Puffed Rice und Puffed Wheat) haben wenig Kalorien, bieten jedoch wenig Nährwert.

Cerealien in Cluster vier, wie Total Corn Flakes und Multi-Grain Cheerios, versorgen Sie mit 100% Ihres täglichen Bedarfs an Vitaminen und Mineralien. Sie haben wenig Fett, Ballaststoffe und Zucker.

Cerealien in Cluster fünf haben einen hohen Protein- und Fettgehalt und wenig Natrium. Der Cluster umfasst Cerealienprodukte wie Banana Nut Crunch und Quaker Oatmeal.

Cerealien in Cluster sechs haben einen niedrigen Fettgehalt und enthalten viel Natrium und Kohlenhydrate. Herkömmliche Cerealienprodukte wie Wheaties und Grape-Nuts sind in diesem Cluster zu finden.

Cerealien in Cluster sieben haben einen hohen Kaloriengehalt und wenig Ballaststoffe. Viele Cerealien, die Trockenfrüchte enthalten, befinden sich in diesem Cluster (Mueslix Healthy Choice, Low Fat Granola w Raisins, Oatmeal Raisin Crisp, Raisin Nut Bran und Just Right Fruit & Nut).

Cerealien in Cluster acht haben wenig Natrium und Zucker und viele komplexe Kohlenhydrate, Protein und Kalium. Die Cerealienprodukte Shredded Wheat und Mini-Wheat befinden sich in diesem Cluster.

Wenn Sie sich die Verbindungen im Dendrogramm ansehen, erkennen Sie, welche Cerealien in jedem Cluster am ähnlichsten sind.

In Cluster eins ist Fiber One vom Nährwert her ähnlich wie All-Bran with Extra Fiber. 100% Bran und All-Bran ähneln sich ebenfalls. Jedes Paar ähnlicher Cerealienprodukte wird von unterschiedlichen Herstellern produziert, d.h. die Cerealienprodukte stehen miteinander im Wettbewerb.

In Cluster zwei sind Frosted Flakes und Honey Frosted Wheaties ähnlich, obwohl es sich bei dem einen Produkt um Maisflocken und bei dem anderen um Weizenflocken handelt. Lucky Charms und Frosted Cheerios sind ähnlich. Cap’n’Crunch und Trix sind ebenfalls ähnlich.

Schlussfolgerungen ziehen

Basierend auf Ihrem Wunsch, mehr Ballaststoffe und weniger Kalorien zu sich zu nehmen, entscheiden Sie sich für die Cerealienprodukte in Cluster eins. Sie vermeiden die Produkte in Cluster drei, die aus gepufftem Weizen und gepufftem Reis bestehen und wenig Nährwert bieten. Und Sie probieren die Cerealien in Cluster vier mit hohem Nährwert.

Möchten Sie weitere Informationen? Habe Fragen? Erhalten Sie Antworten in der JMP-Benutzer-Community (community.jmp.com).