Die empirische Regel

Was ist die empirische Regel?

Die empirische Regel fasst den Prozentsatz der Daten aus einer Normalverteilung zusammen, die innerhalb von einer, zwei oder drei Standardabweichungen des Mittelwerts liegen.

Was sind die Voraussetzungen für die Anwendung der empirischen Regel?

Ihre Daten sollten normalverteilt sein.

Definition der empirischen Regel

Wenn man normale Daten hat, kann man sie mit der empirischen Regel schnell verstehen. Diese Regel wird auch als „68-95-99,7%-Regel“ oder „Drei-Sigma-Regel“ bezeichnet. Die Regel beschreibt den Prozentsatz Ihrer Daten, der innerhalb von einer, zwei oder drei Standardabweichungen des Mittelwerts liegt.

Dies ist leichter zu verstehen, wenn man sich das Diagramm einer Normalverteilung in Abbildung 1 anschaut. Die Mitte des Diagramms – Null auf der x-Achse – stellt den Mittelwert der Daten dar. Die orange gepunkteten vertikalen Linien werden bei einer, zwei und drei Standardabweichungen vom Mittelwert gezeichnet.

Beachten Sie, dass etwa 68 % der Daten innerhalb einer Standardabweichung vom Mittelwert liegen. Denken Sie daran, dass die Normalverteilung eine theoretische Verteilung der Grundgesamtheit ist. Für die Standardabweichung der Grundgesamtheit wird das Symbol s verwendet. Manchmal wird diese Regel auch mit „68 % der Daten liegen innerhalb von ±s vom Mittelwert“ angegeben. 

In ähnlicher Weise können Sie sehen, dass etwa 95 % der Daten innerhalb von zwei Standardabweichungen des Mittelwerts liegen. Dies wird oft mit „95 % der Daten liegen innerhalb von ±2s vom Mittelwert“ angegeben.

Schließlich liegen etwa 99,7 % der Daten innerhalb von drei Standardabweichungen des Mittelwerts. Dies wird oft mit „99,7 % der Daten liegen innerhalb von ±3s vom Mittelwert“ angegeben.

In der Praxis kennen Sie den wahren Mittelwert oder die Standardabweichung der Grundgesamtheit nur selten. Stattdessen schätzen Sie anhand des Stichprobenmittelwerts und der Stichprobenstandardabweichung und verwenden dann diese Regel. 

Abbildung 1: Grafik einer Normalverteilung

Verwendung der empirischen Regel

Wie könnten Sie die empirische Regel bei der Analyse Ihrer Daten anwenden? Unter der Annahme, dass Ihre Daten normalverteilt sind, können Sie mit der empirischen Regel die Wahrscheinlichkeit vorhersagen, dass die gemessenen Ergebnisse in bestimmte Bereiche fallen werden. Wenn Sie feststellen, dass der Prozentsatz der Ergebnisse, die bei verschiedenen Standardabweichungen vom Mittelwert auftreten, von den erwarteten Prozentsätzen abweicht, die durch die empirische Regel beschrieben werden, haben Sie einen wertvollen Hinweis darauf, dass möglicherweise etwas nicht stimmt.

Eine Erklärung könnte sein, dass es in Ihren Daten erhebliche Ausreißer gibt. Wenn Ihre Daten beispielsweise aus Messungen einer bestimmten Zielspezifikation eines hergestellten Artikels bestehen – etwa einer Abmessung in Millimetern – kann dies bedeuten, dass Ihr Herstellungsprozess schlecht kontrolliert wird und Aufmerksamkeit erfordert.

Eine andere Erklärung könnte sein, dass Ihre Stichprobe aus verschiedenen Gründen die größere Grundgesamtheit schlecht repräsentiert oder dass Ihre Stichprobengröße einfach zu klein ist.