Rechner

Stichprobengröße für die einfaktorielle ANOVA berechnen

Während der Vorbereitung zu einer Studie stellt sich die Frage nach der optimalen Stichprobengröße. Ist die Stichprobe zu klein, wird die einfaktorielle ANOVA (auch unabhängiger t-Test genannt) nicht signifikant (auch wenn der Effekt tatsächlich existiert), ist die Stichprobe zu groß, verschwendet man unnötig Zeit und Geld. Mit anderen Worten: Wir müssen sicherstellen, dass unser Experiment ausreichend statistische Power besitzt, um den Effekt auch zu finden.

Wie bereits im Artikel zu statistischer Power näher erläutert, existieren vier Faktoren, welche die Power eines Test beeinflussen. Zu den wichtigsten zählt die Stichprobengröße.

Effektstärke bestimmen

Ein Problem bei der Berechnung der Stichprobengröße ist, dass wir die Effektstärke kennen müssen. Aber wie können wir die Effektstärke kennen, wenn wir unser Experiment noch nicht durchgeführt haben?

  • Pilotstudie. Wenn unser Thema so noch gar nicht erforscht wurde und keine vergleichbaren Daten existieren, können wir eine Pilotstudie mit einer kleinen Stichprobe durchführen und die Effektstärke aus dieser Stichprobe ermitteln.
  • Ähnliche Studien. Eine Möglichkeit ist es, sich thematisch ähnliche Studien anzuschauen und die Effektstärken zu mitteln.
  • Unterste Schätzung. Sollten die beiden oberen Möglichkeiten nicht praktikabel sein, können wir als Effektstärke das Unterste einsetzten, was wir noch als praktisch relevant empfinden würden. Als Richtwert kann man die Empfehlungen von Cohen (1988) verwenden, allerdings ist dies auch kein Muss. Nach Cohen (1988) beispielsweise wäre die Grenze für einen kleinen Effekt bei η² = .01.
    Die Grenzen für die Größe des Effekts liegen nach Cohen (1988) bei .01 (kleiner Effekt), .06 (mittlerer Effekt) und .14 (großer Effekt).
Bei der einfaktoriellen ANOVA sind η² und partielles η² identisch. Als Referenz können beide Maße aus Studien verwendet werden.

Rechner für die Stichprobengröße des gepaarten t-Test

η²
Für Empfehlungen für die Wahl von Cohen’s d, siehe die Diskussion oben.
Gruppen
Anzahl der Gruppen
Alphaniveau
Grenze für ein signifikantes Ergebnis, meist 5 % oder 1 %.
Power
Die statistische Power mit der getestet wird. Generell will man eine möglichst hohe statistische Power. Allerdings kann ein zu hoher Wert hier zu einer unpraktikabel hohen Stichprobengröße führen. In der Regel ist ein Wert von etwa .8 – .9 zu empfehlen.

Literaturverzeichnis

  1. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, New Jersey: Lawrence Erlbaum Associates. ISBN: 0805802835