Lexikon

Statistische Power

(Statistische) Power wird definiert als die Wahrscheinlichkeit, korrekterweise eine falsche Nullhypothese zurückzuweisen. Statistische Power ist die Wahrscheinlichkeit, dass ein Effekt entdeckt wird, wenn ein Effekt auch tatsächlich existiert. Wenn die statistische Power hoch ist, sinkt die Wahrscheinlichkeit, einen Typ-II-Fehler zu begehen oder festzustellen, dass es keinen Effekt gibt, wenn es tatsächlich einen gibt. Damit ist sie gleich 1 − β, wobei β die Wahrscheinlichkeit ist, einen Fehler 2. Art zu begehen. Statistische Power ist eine Funktion der Stichprobengröße (N), der Effektstärke, des verwendeten statistischen Verfahrens und der Wahrscheinlichkeit einen Fehler 1. Art zu begehen.

Statistische Power und ihr Zusammenhang für die Bewertung wissenschaftlicher Studien hat erst in den letzten 20 Jahren mehr Beachtung bekommen. Immer mehr Journals, Leistungsträger und Reviewer verlangen von beteiligten Forschern detaillierte Power-Analysen.

Power-Analysen

Power-Analysen machen eine Aussage darüber, wie hoch die statistische Power für ein Studiendesign ist. Sie werden entweder vor der eigentlichen Datenerhebung durchgeführt, um abzuschätzen wie viele Versuchspersonen für die Durchführung der Studie nötig sind, oder nach der eigentlichen Datenerhebung – dann meist aber wenn die Studie keine signifikanten Ergebnisse geliefert hat. In einem solchen Fall kann eine Power-Analyse Aufschluss darüber geben, wie viele Versuchsteilnehmer noch nötig gewesen wären, damit der Effekt doch ein signifikantes Ergebnis geliefert hätte.

Beim designen einer Studie, legt man gewöhnlicherweise des Powerniveau genauso fest, wie man es auch mit dem Signifikanzniveau tun würde. Oft wird eine statistische Power von 80 % gewählt, so dass ein echter Unterschied in 20% der der Fälle nicht erkannt wird. Dies ist, wie Vieles in der Statistik, ein Kompromiss. Eine Erhöhung der Power auf beispielsweise 90 % würde auch mit einer Erhöhung des Stichprobenumfangs um etwa 30 % einhergehen, bei einer Erhöhung auf 95 % müsste man den Stichprobenumfang sogar um 60 % erhöhen, was in beiden Fällen die Kosten für die Studie auch erheblich erhöhen würde.