Die t-Verteilung
Was ist die t-Verteilung?
Die t-Verteilung beschreibt die standardisierten Abstände der Stichprobenmittelwerte zum Populationsmittelwert, wenn die Standardabweichung der Population unbekannt ist und die Beobachtungen aus einer normalverteilten Population stammen.
Ist die t-Verteilung dasselbe wie die Student-t-Verteilung?
Ja.
Was ist der größte Unterschied zwischen t- und z-Verteilungen?
Die Standard-Normalverteilung oder z-Verteilung setzt voraus, dass Sie die Standardabweichung der Population kennen. Die t-Verteilung basiert auf der Standardabweichung der Stichprobe.
t-Verteilung vs. Normalverteilung
Die t-Verteilung ähnelt einer Normalverteilung. Sie ist mathematisch präzise definiert. Statt uns jedoch mit diesem komplexen mathematischen Konzept zu befassen, betrachten wir lieber die nützlichen Eigenschaften der t-Verteilung und erklären, warum diese für Analysen so wichtig ist.
- Wie die Normalverteilung weist die t-Verteilung eine glatte Form auf.
- Wie die Normalverteilung ist auch die t-Verteilung symmetrisch. Wenn Sie den Graphen beim Mittelwert zusammenklappen würden, wären beide Seiten gleich.
- Und wie die Standard-Normalverteilung (oder z-Verteilung) hat die t-Verteilung einen Mittelwert von Null.
- Die Normalverteilung setzt voraus, dass die Standardabweichung der Population bekannt ist. Bei der t-Verteilung gibt es diese Voraussetzung nicht.
- Die t-Verteilung wird durch die Freiheitsgrade definiert. Diese stehen im Zusammenhang mit der Stichprobengröße.
- Die t-Verteilung ist am nützlichsten bei kleinen Stichprobengrößen, wenn die Standardabweichung unbekannt ist, oder sogar beides zutrifft.
- Mit wachsender Stichprobengröße ähnelt die t-Verteilung immer mehr einer Normalverteilung.
Betrachten Sie den folgenden Graphen, in dem drei t-Verteilungen mit einer Standard-Normalverteilung verglichen werden:
Alle Verteilungen weisen eine glatte Form auf. Alle sind symmetrisch. Alle haben einen Mittelwert von Null.
Die Form der t-Verteilung hängt von den Freiheitsgraden ab. Die Kurven mit mehr Freiheitsgraden sind höher und haben dünnere Verteilungsenden. Alle drei t-Verteilungen haben „dickere“ Verteilungsenden als die z-Verteilung.
Wie Sie erkennen können, sehen die Kurven mit mehr Freiheitsgraden eher nach einer z-Verteilung aus. Vergleichen Sie die rosafarbene Kurve mit einem Freiheitsgrad mit der grünen Kurve für die z-Verteilung. Die t-Verteilung mit einem Freiheitsgrad ist kürzer und hat dickere Verteilungsenden als die z-Verteilung. Vergleichen Sie anschließend die blaue Kurve mit 10 Freiheitsgraden mit der grünen Kurve für die z-Verteilung. Diese beiden Verteilungen ähneln sich stark.
Eine gute Faustregel lautet, dass Sie bei einer Stichprobengröße von mindestens 30 die z-Verteilung anstelle einer t-Verteilung nutzen können. Abbildung 2 unten zeigt eine t-Verteilung mit 30 Freiheitsgraden und eine z-Verteilung. In der Abbildung wird z mit einer gepunkteten grünen Kurve dargestellt, damit Sie beide Kurven sehen können. Die Ähnlichkeit ist ein Grund dafür, warum die z-Verteilung bei statistischen Methoden anstelle einer t-Verteilung eingesetzt wird, wenn die Stichproben groß genug sind.
Verteilungsenden für Hypothesentests und die t-Verteilung
Wenn Sie einen t-Test durchführen, testen Sie, ob Ihre Prüfgröße extremer ist als Ihre Erwartung aus der t-Verteilung.
Bei einem Test mit zwei Verteilungsenden sehen Sie sich beide Enden der Verteilung an. Abbildung 3 unten zeigt den Entscheidungsprozess für einen Test mit zwei Verteilungsenden. Die Kurve ist eine t-Verteilung mit 21 Freiheitsgraden. Der Wert aus der t-Verteilung mit α = 0,05/2 = 0,025 ist 2,080. Für einen Test mit zwei Verteilungsenden verwerfen Sie die Null-Hypothese, wenn die Prüfgröße größer als der absolute Wert des Referenzwerts ist. Wenn die Prüfgröße entweder im unteren oder im oberen Verteilungsende liegt, verwerfen Sie die Null-Hypothese. Wenn die Prüfgröße innerhalb der beiden Referenzlinien liegt, können Sie die Null-Hypothese nicht verwerfen.
Bei einem Test mit einem Verteilungsende sehen Sie sich nur ein Ende der Verteilung an. Abbildung 4 unten zeigt zum Beispiel den Entscheidungsprozess für einen Test mit einem Verteilungsende. Die Kurve ist wieder eine t-Verteilung mit 21 Freiheitsgraden. Bei einem Test mit einem Verteilungsende ist der Wert aus der t-Verteilung für α = 0,05 die Zahl 1,721. Sie verwerfen die Null-Hypothese, wenn die Prüfgröße größer als der Referenzwert ist. Wenn die Prüfgröße unterhalb der Referenzlinie liegt, können Sie die Null-Hypothese nicht verwerfen.
So verwenden Sie eine t-Tabelle
Die meisten Anwender nutzen Software für die Berechnungen, die bei t-Tests erforderlich sind. Doch auch viele Statistikbücher enthalten t-Tabellen, also sollten Sie auch wissen, wie Sie eine solche Tabelle benutzen. In den folgenden Schritten wird beschrieben, wie Sie eine übliche t-Tabelle verwenden.
- Finden Sie heraus, ob die Tabelle für Tests mit zwei oder mit einem Verteilungsende vorgesehen ist. Entscheiden Sie anschließend, ob Sie einen Test mit einem oder mit zwei Verteilungsenden durchführen möchten. Die Spalten einer t-Tabelle geben verschiedene Alpha-Niveaus an.
Wenn Sie eine Tabelle für einen Test mit einem Verteilungsende haben, können Sie diese immer noch bei einem Test mit zwei Verteilungsenden einsetzen. Wenn Sie α = 0,05 für Ihren Test mit zwei Verteilungsenden festlegen und nur eine Tabelle für ein Verteilungsende haben, nehmen Sie die Spalte für α = 0,025. - Ermitteln Sie die Freiheitsgrade für Ihre Daten. Die Zeilen einer t-Tabelle entsprechen den verschiedenen Freiheitsgraden. Die meisten Tabellen enthalten bis zu 30 Freiheitsgrade. Die Autoren der Tabellen gehen davon aus, dass bei größeren Stichproben eine z-Verteilung verwendet wird.
- Suchen Sie in der Tabelle die Zelle, in der sich Ihr α-Niveau und Ihre Freiheitsgrade schneiden. Das ist der t-Verteilungswert. Vergleichen Sie Ihre Prüfgröße mit dem t-Verteilungswert und ziehen Sie die entsprechende Schlussfolgerung.