Gepaarter t-Test: Einseitig testen
Wenn wir einen gepaarten t-Test in SPSS durchführen, bezieht sich der angegebene p-Wert (die Signifikanz) immer für eine zweiseitige Testung. In diesem Artikel besprechen wir, was das bedeutet und wie wir einen zweiseitigen p-Wert in einen einseitigen umrechnen können.
Zweiseitig vs. einseitig
Nicht nur bei den p-Werten, sondern auch bei der Hypothesenformulierung und -aufstellung gibt es Unterschiede für ein- und zweiseitige t-Tests. Bei einer zweiseitigen Hypothese interessiert uns nur, ob sich die Werte voneinander unterscheiden – nicht, ob eine Gruppe einen höheren oder niedrigeren Mittelwert als die andere Gruppe besitzt hat. Diese Hypothesenart bezeichnet man auch als ungerichtet. Bei einem einseitigen Test ist das anders. Hier spricht man von gerichteten Hypothesen. Wir haben also bereits eine Vermutung darüber, dass eine Gruppe einen höheren / niedrigeren Wert gegenüber der anderen Gruppe haben wird.
Beispiel
In unserem Beispieldatensatz untersuchen wir, inwieweit Katzenvideos Depressionswerte senken können. Unsere ungerichtete Hypothese hätte demnach sein können „Die BDI-Werte unterscheiden sich signifikant zwischen den beiden Messzeitpunkten“. Wir vermuten allerdings, dass die süßen Katzenvideos generell einen senkenden Effekt auf die BDI-Werte haben werden. Unsere gerichtete Hypothese wäre daher: „Die BDI-Werte vor der Präsentation der süßen Katzenvideos sind signifikant höher als nach der Präsentation“.
Warum einseitig testen?
Warum sollte man sich also den ganzen Aufwand machen und überhaupt einseitig testen? Viele Wissenschaftler argumentieren, dass es meist nicht sinnvoll ist, einen einseitigen Test durchzuführen und auch SPSS gibt nur das Ergebnis für den zweiseitigen Test an.
Allerdings, wenn es beispielsweise unmöglich ist, dass die Werte in die andere Richtung gehen (z.B. das die durchschnittliche Körpergröße von 10-Jährigen höher ist als die durchschnittliche Körpergröße von 20-Jährigen) oder wenn ein Ergebnis in die andere Richtung keine praktische Bedeutung hätte (z.B. dass ein neues Medikament schlechter wäre als ein bereits etabliertes) sollte ein einseitiger Test in Betracht gezogen werden.
Ein weitere Grund ist, dass ein einseitiger gepaarter t-Test mehr statistische Power haben wird als sein zweiseitiges Gegenstück. In anderen Worten: auch wenn die Wahrscheinlichkeit, einen Fehler erster Art zu begehen, gleich bleibt (das Alphaniveau, das wir gewählt haben), sinkt die Wahrscheinlichkeit, einen Fehler zweiter Art zu begehen. Mit einem einseitigen Test werden wir daher eher einen signifikanten Unterschied finden, wenn er besteht.
Einseitig testen
SPSS kann keine gerichteten Hypothesen berechnen, also dass eine Gruppe größer bzw. kleiner als die andere Gruppe ist. SPSS berechnet immer den ungerichteten, also zweiseitigen, t-Test und hat leider bislang keine Option das zu ändern. Allerdings ist es denkbar einfach, von einem zweiseitigen auf einen einseitigen p-Wert umzurechnen.
Die Formel für die Umrechnung hängt von den Mittelwerten beider Gruppen und unserer Hypothese ab. Unsere Hypothese war, dass die durchschnittlichen BDI-Werte nach dem Anschauen der süßen Katzenvideos niedriger sein werden, als davor, was sich bei einem Blick auf die deskriptiven Statistiken bestätigt.
Statistik bei gepaarten Stichproben | |||||
---|---|---|---|---|---|
Mittelwert | N | Std.-Abweichung | Standardfehler des Mittelwertes | ||
Paaren 1 | BDI (pre) | 48.05 | 100 | 4.628 | .463 |
BDI (post) | 47.31 | 100 | 5.794 | .579 |
Da die Daten unsere Hypothese bestätigen, müssen wir den zweiseitigen p-Wert lediglich durch Zwei teilen, um den einseitigen p-Wert zu erhalten. Wäre dies nicht der Fall gewesen und die BDI-Werte nach dem Anschauen der Katzenvideos höher gewesen, hätten wir den p-Wert allerdings nicht einfach halbieren dürfen. In diesem Fall wäre unser p-Wert nicht \(\frac{p_\mathrm{zweiseitig}}{2}\) gewesen, sondern \(1-\frac{p_\mathrm{zweiseitig}}{2}\).
Beispiel
In unserem Beispiel unten haben wir einen gepaarten t-Test, der bei einer zweiseitigen Testung knapp nicht signifikant geworden ist, p = .067 (unten gelb markiert).
Gepaarte Differenzen | |||||||||
95% Konfidenzintervall der Differenz | |||||||||
Mittelwert | Std.-Abweichung | Standardfehler des Mittelwertes | Untere | Obere | T | df | Sig. (2-seitig) | ||
Paaren 1 | heart_mean1 – heart_mean2 | -0,97686 | 3,72700 | 0,52188 | -2,02509 | 0,07138 | -1,872 | 50 | 0,067 |
Wenn wir einseitig getestet hätten, hätten wir einen p-Wert von \(\frac{.067}{2} = \mathbf{.034}\) (gerundet) erhalten, da unsere Daten unsere gerichtete Hypothese bestätigen. Wäre die Hypothese allerdings nicht bestätigt worden, hätten wir einen neuen p-Wert von \(1-\frac{.067}{2} = \mathbf{.967}\) (gerundet) erhalten.