Balkendiagramm
Was ist ein Balkendiagramm?
Ein Balkendiagramm zeigt die Häufigkeiten von Werten für Stufen einer kategorialen oder nominalen Variable.
Wie werden Balkendiagramme verwendet?
Balkendiagramme helfen Ihnen dabei, die Stufen Ihrer Variable nachzuvollziehen, und können zur Prüfung auf Fehler verwendet werden.
Welche Fragen sollten Sie berücksichtigen?
Balkendiagramme werden für nominale oder kategoriale Daten verwendet. Für stetige Daten sollten Sie stattdessen ein Histogramm verwenden.
Balkendiagramme zeigen die Häufigkeiten von Daten
Balkendiagramme zeigen die Häufigkeiten von Werten für verschiedene Stufen einer kategorialen oder nominalen Variable. Manchmal dienen Balkendiagramme auch zur Darstellung anderer statistischer Kenngrößen wie Prozentsätze. Abbildung 1 zeigt ein Beispiel mit einem Balkendiagramm für Antworten auf eine Umfrage.
Die Balken zeigen die Stufen der Variable; die Höhe der Balken zeigt die Häufigkeit der Antworten für die jeweilige Stufe.
Wie unterscheiden sich Balkendiagramme und Histogramme?
Zwei wichtige Unterschiede zwischen Histogrammen und Balkendiagrammen sind die Lücken zwischen den Balken und die Datentypen. Histogramme weisen keine Lücken zwischen den Balken auf, Balkendiagramme hingegen schon. Zahlreiche Software-Tools ermöglichen Ihnen jedoch, ein Balkendiagramm so anzupassen, dass es keine Lücken zwischen den Balken gibt. Das führt uns zum zweiten wichtigen Unterschied zwischen Histogrammen und Balkendiagrammen.
Histogramme kommen bei stetigen Daten zum Einsatz; Balkendiagramme dagegen bei kategorialen oder nominalen Daten. Weitere Einzelheiten finden Sie unten im Abschnitt „Balkendiagramme und Datentypen“.
Wie unterscheiden sich Balkendiagramme und Pareto-Diagramme?
Ein Pareto-Diagramm ist eine Sonderform des Balkendiagramms. Bei einem Pareto-Diagramm werden die Balken in absteigender Reihenfolge sortiert. Diese Diagramme werden oft in der Qualitätskontrolle genutzt, um die Bereiche mit den meisten Problemen zu ermitteln.
Wie das Histogramm hat auch ein Pareto-Diagramm keine Lücken zwischen den Balken. Anders als ein Histogramm fasst das Pareto-Diagramm jedoch die Häufigkeiten für eine nominale oder kategoriale Variable zusammen.
Abbildung 2 liefert ein Beispiel für ein Pareto-Diagramm, das die Erkenntnisse aus einer Prüfung von Geschäftsprozessen zusammenfasst. Es umfasst eine Legende für die Kategorien, wodurch längere Beschriftungen möglich werden, die das Lesen der Kategorien erleichtern.
Andere statistische Kenngrößen als die Häufigkeit darstellen
In allen Beispielen sind Balkendiagramme mit Häufigkeiten zu sehen, doch diese Graphen können auch andere statistische Kenngrößen wie Prozentanteile zeigen. Die meisten Software-Werkzeuge bieten Optionen für die statistischen Kenngrößen im Diagramm.
Beispiele für Balkendiagramme
Oft kommt bei der Erstellung von Balkendiagrammen Software zum Einsatz. Die Software ermöglicht den Benutzern für gewöhnlich das Erstellen vertikaler und horizontaler Balkendiagramme sowie das Hinzufügen eigener Merkmale zum Balkendiagramm.
Unten finden Sie einige Beispiele für Balkendiagramme. Wenn Sie überlegen, welche Art von Balkendiagramm für Ihre Daten am besten geeignet ist, fragen Sie am besten einen Statistiker oder Nutzen Sie die vielen verfügbaren Bücher und Websites zur Recherche.
Für die Abbildungen 3–15 wurden Daten aus 10 Bonbontüten herangezogen. Jede Tüte enthält 100 Bonbons und die Häufigkeit der fünf Geschmacksrichtungen wurde für jede Tüte erfasst. Das Ziel besteht darin, dass jede Tüte nahezu die gleichen Häufigkeiten für jede Geschmacksrichtung enthält. Wir erwarten also knapp 20 Bonbons jeder Geschmacksrichtung pro Tüte. Für 10 Tüten erwarten wir dementsprechend ca. 200 Bonbons jeder Geschmacksrichtung.
Unser erster Schritt besteht darin, ein Balkendiagramm aus den Daten zu erstellen, wie in Abbildung 3 zu sehen:
Die Software sortiert die Balken alphabetisch nach dem Namen der Geschmacksrichtung. Das könnte für Ihre Zielgruppe die beste Methode zum Anzeigen der Ergebnisse sein.
Sie können die Balken aber auch absteigend nach Häufigkeit sortieren, wie in Abbildung 4 zu sehen:
Wir sehen jetzt, dass die Gesamthäufigkeiten der Bonbons für Traube und Orange gleich sind. Das war auch schon in Abbildung 3 der Fall, doch dort war es nicht so leicht zu erkennen.
Die Balken sind vertikal. Bei langen Graphenbeschriftungen ist ein horizontales Balkendiagramm oft besser geeignet. Abbildung 5 zeigt dieselben Daten mit längeren Beschriftungen für die Geschmacksrichtungen in einem horizontalen Diagramm. Hätten wir stattdessen ein vertikales Balkendiagramm benutzt, wären die Beschriftungen schwieriger zu lesen gewesen.
Wir haben in diesem Beispiel für alle Balken dieselbe Farbe verwendet. Generell gilt: Je mehr Farben Sie benutzen, desto schwieriger ist der Graph zu verstehen.
Nehmen wir jedoch einmal an, dass das Bonbonunternehmen verlangt, dass in jeder Tüte mindestens 18 Stück jeder Geschmacksrichtung sind. Für 10 Tüten brauchen wir dann mindestens 180 Bonbons jeder Geschmacksrichtung. Da laut unseren Daten nur 120 Bonbons mit Kirschgeschmack vorhanden sind, möchten wir dieses Problem hervorheben. Abbildung 6 stellt das mithilfe eines schattierten Balkens dar. Eine andere Möglichkeit wäre, den Kirschgeschmack-Balken in einer anderen Farbe einzuzeichnen.
Es kann empfehlenswert sein, Beschriftungen zu den Balken hinzuzufügen. In Abbildung 7 wurde am Ende jedes Balkens die Häufigkeit hinzugefügt. So wird gezeigt, dass wir möglicherweise ein Problem mit der Geschmacksrichtung „Red Candy Apple“ haben: Sie erfüllt unsere Anforderung von 18 Bonbons pro Tüte, aber nur knapp.
So wirken sich extreme Datenwerte auf Balkendiagramme aus
Balkendiagramme zeigen die Häufigkeiten innerhalb von Kategorien in Ihren Daten an. Im Gegensatz zu Histogrammen werden Balkendiagramme nicht von Extremwerten beeinflusst. Im Balkendiagramm wird einfach nur ein zusätzlicher Balken für die Kategorie mit sehr wenigen (oder sehr vielen) Werten im Balken angezeigt. In Abbildung 8 ist ein anderer Satz mit Daten zu Süßigkeiten zu sehen, wobei „Traubengeschmack“ durch „Mango“ ersetzt wurde. Die Häufigkeit für Mango ist viel niedriger als erwartet.
Abbildung 9 zeigt ein weiteres Beispiel, bei dem Traube durch Ananas ersetzt wurde. Die Häufigkeit für Ananas ist viel höher als erwartet.
Balkendiagramme können Ihnen helfen, falsche Werte in Ihren Daten zu erkennen. In Abbildung 10 wurde „Mango“ für einen Datenwert als „Mangi“ geschrieben – ein klarer Datenfehler, der korrigiert werden sollte. Das Prüfen auf Datenfehler mit Balkendiagrammen ist sehr effizient.
Wie füge ich Gruppen zu Balkendiagrammen hinzu?
Wenn es in Ihren Daten Gruppen gibt, können Sie diese alle zusammen in ein Balkendiagramm einzeichnen, um Muster für diese Gruppen aufzuzeigen. In Abbildung 11 wurden die Daten von drei Bonbonfabriken kombiniert.
Aus dieser Abbildung können Sie erkennen, welche Fabriken welche Geschmacksrichtung in Bonbontüten verwenden. Sie sehen auch, welche Probleme auftreten. Zum Beispiel hat Fabrik A zu wenige Mango-Bonbons in den Tüten. In diesem Beispiel ist es sinnvoll, die Balken alphabetisch zu sortieren. Wir können nicht nach Häufigkeit sortieren, weil die Reihenfolge dann für jede Fabrik unterschiedlich wäre.
In diesem Beispiel ist es vielleicht hilfreich, unterschiedliche Farben für die verschiedenen Fabriken zu benutzen. Abbildung 12 zeigt jede Fabrik mit einer anderen Farbe.
Sie können die Häufigkeiten auf der horizontalen Achse anzeigen lassen, um sie leichter visuell vergleichen zu können (siehe Abbildung 13).
Abbildung 13 erleichtert zwar den Vergleich der Häufigkeiten für die verschiedenen Geschmacksrichtungen, im Vergleich zu Abbildung 12 ist allerdings nicht so leicht ersichtlich, welche Geschmacksrichtungen in den verschiedenen Fabriken verwendet werden.
Das sind nur einige der vielen Möglichkeiten, Gruppen in Balkendiagramme einzubinden. Für Ihre Daten müssen Sie die Botschaft an Ihre Zielgruppe berücksichtigen und überlegen, mit welcher Grafik Sie diese Botschaft am besten unterstreichen können.
Gestapelte Balkendiagramme
Statt Gruppen zu verwenden, können Sie auch ein gestapeltes Balkendiagramm einsetzen. Mit einem gestapelten Balkendiagramm veranschaulichen Sie die Antworten für Ihre Gruppen, also im Falle der Bonbondaten die Fabriken. Jede Gruppe wird durch einen Balken repräsentiert. Die Häufigkeiten für Ihre Variable werden dann innerhalb des Balkens für die einzelnen Fabriken gestapelt. Im Falle der Bonbondaten werden die Häufigkeiten der Geschmacksrichtungen im Balken für jede Fabrik gestapelt. Abbildung 14 zeigt ein gestapeltes Balkendiagramm für die Bonbondaten aus den drei Fabriken, wobei für jede Geschmacksrichtung eine andere Farbe verwendet wird.
In Abbildung 14 können wir leicht erkennen, dass Mango jeweils nur von Fabrik A, Ananas jeweils nur von Fabrik B und Traube jeweils nur von Fabrik C verwendet wird. Wenn wir die Größe der gestapelten Balkenabschnitte vergleichen, erkennen wir außerdem, dass Fabrik A sehr wenige Mango-Bonbons verwendet, Fabrik B allerdings eine Menge Ananas-Bonbons.
Einem gestapelten Balkendiagramm müssen Sie unbedingt eine Legende hinzufügen.Viele Software-Werkzeuge ermöglichen Ihnen das Hinzufügen von Beschriftungen zu einem gestapelten Balkendiagramm, wie in Abbildung 15 gezeigt. Die Beschriftungen helfen uns zum Beispiel, zu erkennen, dass Fabrik B dieselbe Gesamthäufigkeit für die Geschmacksrichtungen Kirsche und Orange aufwies.
Es kann helfen, ein gestapeltes Balkendiagramm zunächst in Graustufen auszugeben, bevor Sie sich für die Farben entscheiden. Außerdem müssen Sie beim Hinzufügen von Beschriftungen prüfen, dass die Beschriftungen auch mit der Hintergrundfarbe für jedes Element des gestapelten Balkens lesbar sind, wie in Abbildung 15 zu sehen.
Balkendiagramme und Datentypen
Die Abbildungen 16 bis 20 zeigen, wann Balkendiagramme oder Histogramme für unterschiedliche Datentypen geeignet sind.
Kategoriale oder nominale Daten: Eignung für Balkendiagramme
Balkendiagramme sind für kategoriale oder nominale Daten sinnvoll, da sie auf einer Skala spezifischer möglicher Werte gemessen werden.
Bei kategorialen Daten wird die Stichprobe oft in Gruppen aufgeteilt und die Antworten haben eine feste Reihenfolge. Wenn Sie zum Beispiel in einer Umfrage gebeten werden, Ihre Meinung auf einer Skala von „Stimme überhaupt nicht zu“ bis „Stimme voll und ganz zu“ anzugeben, sind Ihre Antworten kategorial.
Bei nominalen Daten ist die Stichprobe zudem in Gruppen ohne bestimmte Reihenfolge aufgeteilt. „Wohnsitzland“ wäre ein Beispiel für eine nominale Variable. Sie können den Ländercode oder Zahlen benutzen, um den Ländernamen abzukürzen. Wie Sie es auch anstellen, Sie benennen die verschiedenen Gruppen für die Daten.
Stetige Daten: Histogramme verwenden
Balkendiagramme eigenen sich nicht für stetige Daten, da diese auf einer Skala mit vielen möglichen Werten gemessen werden. Beispiele für stetige Daten sind:
- Alter
- Blutdruck
- Gewichtung
- Temperatur
- Geschwindigkeit
In all diesen Fällen sollten Sie Histogramme statt Balkendiagrammen verwenden.