Die Plattform „Verteilung“ veranschaulicht die Verteilung einer einzelnen Variable (univariate Analyse) mit Hilfe von Histogrammen, zusätzlichen Graphen und Berichten. Der Begriff univariat bedeutet lediglich, dass eine Variable und nicht zwei (bivariat) oder viele Variablen (multivariat) beteiligt sind. Sie können die Verteilung mehrerer einzelner Variablen jedoch in einem einzigen Bericht untersuchen. Der Berichtsinhalt für jede Variable unterscheidet sich abhängig davon, ob die Variable kategorial (nominal oder ordinal) oder stetig ist.
• Bei kategorialen Variablen ist der erste Graph ein Histogramm. Das Histogramm zeigt einen Balken für jede Stufe der ordinalen oder nominalen Variable. Die Berichte zeigen Häufigkeiten und Anteile.
• Bei stetigen Variablen zeigen die ersten Graphen ein Histogramm und einen Ausreißer-Box-Plot. Das Histogramm zeigt einen Balken für gruppierte Werte der stetigen Variable. Die Berichte zeigen ausgewählte Quantile und statistische Kennzahlen.
Sobald Sie wissen, wie Ihre Daten verteilt sind, können Sie die angemessenen Arten von Analysen planen, mit denen Sie arbeiten möchten.
Hinweis: Weitere Informationen zur Plattform „Verteilung“ finden Sie unter Basic Analysis.
Sie möchten die Nährwerte von Cerealien untersuchen, damit Sie sich gesünder ernähren können. Die Analyse der Verteilungen von Cerealiendaten liefert Antworten auf die folgenden Fragen:
• Welche Cerealien haben den höchsten Ballaststoffanteil?
• Wie hoch ist der durchschnittliche, minimale und maximale Kaloriengehalt?
• Wie hoch ist der Median des Fettgehalts?
• Welche Cerealien enthalten am meisten Fett?
• Enthalten die Daten Ausreißer?
1. Wählen Sie Hilfe > Beispieldatenordner und öffnen Sie Cereal.jmp.
2. Wählen Sie Analysieren > Verteilung aus.
3. Drücken Sie die Strg-Taste und klicken Sie auf Manufacturer, Calories, Fat und Fiber.
4. Klicken Sie auf Y, Spalten und dann auf OK.
Abbildung 6.2 Verteilungen für Manufacturer, Calories, Fat und Fiber
Beachten Sie in der Verteilung von „Fiber“ Folgendes:
– Fiber One und All-Bran with Extra Fiber enthalten am meisten Ballaststoffe. Dies ist im Box-Plot „Fiber“ ersichtlich. Diese Cerealien sind in Bezug auf den Ballaststoffanteil Ausreißer.
Die Zeile mit Fiber One in Cereal.jmp ist beschriftet. Diese Beschriftung zeigt den Namen des Cerealienprodukts neben einem Datenpunkt in Graphen. Um die gesamte Beschriftung anzuzeigen, ziehen Sie den äußeren rechten Rahmen nach rechts. Positionieren Sie den Mauszeiger auf dem unbeschrifteten Datenpunkt, um „All Bran with Extra Fiber“ anzuzeigen.
Beachten Sie in der Verteilung von „Fat“ Folgendes:
– Positionieren Sie den Mauszeiger auf dem obersten Datenpunkt (Symbol x) im Box-Plot „Fat“, um anzuzeigen, dass es sich um 100% Nat. Bran Oats & Honey handelt. Bran Oats & Honey den höchsten Fettanteil hat.
– Im Quantilbericht „Fat“ ist der Fett-Median 1 Gramm.
Beachten Sie im Quantilbericht „Calories“ Folgendes:
– Die maximale Anzahl Kalorien beträgt 250.
– Die minimale Anzahl Kalorien beträgt 50.
5. Klicken Sie im Histogramm „Manufacturer“ auf den Balken für Nabisco.
Abbildung 6.3 Verteilungen für Cerealien von Nabisco
Die Verteilungen für Kalorien, Fett und Ballaststoffe für Nabisco-Cerealien sind in den anderen Histogrammen hervorgehoben. Sie können die Kalorien-, Fett- und Ballaststoffverteilungen für die Nabisco-Cerealien relativ zu den Kalorien-, Fett- und Ballaststoffverteilungen der Gesamtdaten anzeigen. So scheint die Fettverteilung von Nabisco-Cerealien niedriger zu sein als die Fettverteilung der Gesamtdaten.
6. Klicken Sie oberhalb des ersten Balkens „Fiber“, um alle Balken abzuwählen.
7. Drücken Sie die Umschalttaste und klicken Sie im Histogramm „Fiber“ auf alle Histogrammbalken mit einem Wert über 8.
Abbildung 6.4 Cerealien mit einem hohen Ballaststoffanteil
Die Cerealien mit dem höchsten Ballaststoffanteil werden in den Histogrammen „Calories“ und „Fat“ hervorgehoben. Da die Histogramme verknüpft sind, ist zu beachten, dass einige Cerealien mit hohem Ballaststoffanteil auch einen geringen Fettanteil haben.
8. Drücken Sie die Strg- und die Umschalttaste und heben Sie die Auswahl der zwei Kalorien-Histogrammbalken auf, die sich an oder nahe 200 befinden.
Cerealien mit hohem Kaloriengehalt werden aus den Histogrammen entfernt.
Abbildung 6.5 Cerealien mit hohem Ballaststoffanteil und niedrigem Kaloriengehalt
Tipp: Lassen Sie den Bericht der Verteilungen geöffnet. Sie benötigen ihn später in einer Clusteranalyse. Siehe Ähnliche Werte in der Plattform „Clustern“ analysieren.
Wenn Sie sich die Ergebnisse ansehen, können Sie die folgenden Fragen beantworten:
Welche Cerealien haben den höchsten Ballaststoffanteil?
Der Box-Plot „Fiber“ zeigt, dass All-Bran with Extra Fiber und Fiber One den höchsten Ballaststoffanteil haben. Diese beiden Cerealienprodukte sind Ausreißer.
Wie hoch ist der durchschnittliche, minimale und maximale Kaloriengehalt?
Das Histogramm von „Calories“ zeigt, dass der Kaloriengehalt eine Bandbreite von 50 bis 275 aufweist. Die Quantile von „Calories“ zeigen, dass der Kaloriengehalt eine Bandbreite von 50 bis 250 aufweist und der Median des Kaloriengehalts bei 120 liegt. Es liegt keine Gleichverteilung vor.
Wie hoch ist der Median des Fettgehalts?
Der Quantilbericht „Fat“ zeigt, dass der Median des Fettanteils bei 1 Gramm liegt.
Welche Cerealien enthalten am meisten Fett?
Der Box-Plot „Fat“ zeigt, dass 100% Nat. Bran Oats & Honey den höchsten Fettanteil hat. Dieses Cerealienprodukt ist ein Ausreißer.
Um den Ballaststoffanteil in Ihrer Ernährung zu erhöhen, entscheiden Sie sich für All-Bran with Extra Fiber und Fiber One. Diese Cerealien haben weniger Kalorien und weniger Fett. Die meisten Cerealien erhöhen den Fettanteil in Ihrer Ernährung nicht sehr stark, doch Sie möchten auf jeden Fall den hohen Fettanteil von 100% Nat. Bran Oats & Honey vermeiden. Und auch wenn die meisten Cerealien einen relativ geringen Fettanteil haben, haben Sie nicht unbedingt auch einen geringen Kaloriengehalt.