Mosaikdiagramm
Was ist ein Mosaikdiagramm?
Ein Mosaikdiagramm ist eine besondere Art des gestapelten Balkendiagramms, das Prozentsätze von Daten in Gruppen zeigt. Das Diagramm ist die grafische Darstellung einer Kontingenztabelle.
Wie werden Mosaikdiagramme verwendet?
Mosaikdiagramme werden verwendet, um Beziehungen zu veranschaulichen und einen visuellen Vergleich zwischen Gruppen zu ermöglichen.
Mosaikdiagramme zeigen Beziehungen
Ein Mosaikdiagramm ist eine Sonderform des gestapelten Balkendiagramms. Für zwei Variablen ist die Breite der Balken proportional zur Anzahl der Beobachtungen in jeder Stufe der Variable, die auf der horizontalen Achse eingezeichnet sind. Die vertikale Länge der Balken entspricht der Anzahl der Beobachtungen in der zweiten Variable für jede Stufe der ersten Variable.
Mosaikdiagramme helfen dabei, Zusammenhänge zu erkennen, und bieten eine visuelle Methode zum Gruppenvergleich. Abbildung 1 zeigt ein Mosaikdiagramm für Daten aus einer klinischen Studie. Das Ziel besteht darin, die Verteilung der Patienten über 65 Jahre in der Placebo- und in der Medikamentengruppe zu vergleichen. Idealerweise sollte in der klinischen Studie der Anteil der Senioren in jeder Gruppe gleich sein.
Das Mosaikdiagramm in Abbildung 1 zeigt, dass in der Placebo-Gruppe ein höherer Prozentsatz älterer Patienten gegeben ist als in der Wirkstoffgruppe der Studie. Das Team hinter der Studie muss entscheiden, ob die Anteile „ähnlich genug“ sind, um das Ziel zu erreichen. Dieses Mosaikdiagramm zeigt auch, dass insgesamt ein niedrigerer Anteil älterer Menschen gegeben ist.
Beispiele für Mosaikdiagramme
Beispiel 1: Beschriftungen hinzufügen
Abbildung 2 erweitert das Basisbeispiel um Beschriftungen im Mosaikdiagramm.
Wir sehen nun, dass beim Prozentsatz der älteren Patienten eine Differenz von 10 % zwischen den Placebo- und Wirkstoffgruppen besteht. Mit einem Chi-Quadrat-Test auf Unabhängigkeit können wir prüfen, ob diese Differenz signifikant ist.
Es bietet sich an, Beschriftungen zu Mosaikdiagrammen hinzuzufügen, wenn nur wenige Zellen vorhanden sind. Sind viele Zellen gegeben, werden die kleinsten vielleicht nicht unbedingt beschriftet. Wenn Ihr Datensatz klein ist, können Sie statt Prozentangaben Häufigkeitsbeschriftungen verwenden, um hervorzuheben, dass Ihre Visualisierung auf beschränkten Informationen basiert.
Beispiel 2: Zwei Variablen für Kategorien
Mosaikdiagramme können auf mehr als zwei Variablen erweitert werden. Der Graph in Abbildung 3 zeigt die Überlebenswahrscheinlichkeit für Passagiere auf der Titanic in Prozent. Die Kategorien werden durch die Kombination aus Stufen für die Fahrkartenklasse und das Geschlecht des Passagiers gebildet.
Beispiel 3: Prozentsätze auf der x-Achse.
Mithilfe von Mosaikdiagrammen können Prozentsätze auf der x-Achse dargestellt werden. Abbildung 4 zeigt Daten für Schüler in städtischen und ländlichen Schulen. Die Schüler wurden zu ihrem vorrangigen Ziel befragt: gute Noten, gute sportliche Leistungen oder Beliebtheit.
Das Mosaikdiagramm zeigt, dass die Ziele von Schülern in Städten und ländlichen Gegenden einander stark ähneln, und dass die Prozentsätze sehr nahe aneinander liegen. Die Schüler in ländlichen Gegenden haben verschiedene Ziele und sind sehr ausgeglichen auf die drei Ziele verteilt. Sie können ein Mosaikdiagramm auch mit Häufigkeiten beschriften.
Beispiel: Sortierte Reihenfolgen verwenden
Manchmal zeigt das Mosaikdiagramm aufgrund der Kategorien eine natürliche Reihenfolge. Ein Beispiel dafür sind die Daten der Titanic-Überlebenden in Beispiel 2.
Wenn das Mosaikdiagramm keine natürliche Reihenfolge aufweist, sind visuelle Vergleiche damit nur schwer möglich. Der Graph in Abbildung 5 zeigt die Verteilung der Fertigungsstandorte innerhalb der Fahrzeugkategorien.
Wir sehen, dass alle großen Kraftfahrzeuge in den USA hergestellt werden, doch der Vergleich der Prozentsätze von Kompakt- und Mittelklasse-Fahrzeugen, die in den USA gefertigt werden, gestaltet sich schwierig.
Wir können das Mosaikdiagramm optimieren, indem wir die Fahrzeugkategorien in ansteigender Reihenfolge sortieren – je nach Prozentsatz der in den USA hergestellten Fahrzeuge. Abbildung 6 zeigt das überarbeitete Mosaikdiagramm. Wir können die Gruppen in diesem Diagramm jetzt einfacher vergleichen.
Jetzt sehen wir, dass in den USA mehr Kompaktwagen als Mittelklassewagen hergestellt werden. Das sortierte Diagramm zeigt außerdem klar, dass alle Großfahrzeuge in den USA hergestellt werden.