Lexikon

Stichprobenverteilung

Eine Stichprobenverteilung beschreibt die Verteilung der Wahrscheinlichkeit, mit der jeder mögliche Wert aus einer Statistik zufällig aus einer Grundgesamtheit gezogen werden kann.

Gehen wir davon aus, dass wir aus einer Grundgesamtheit alle möglichen Stichproben der Größe n ziehen möchten. Desweiteren berechnen wir für jede Stichprobe eine Statistik (z.B. Mittelwert, Standardabweichung, Median, …). Die Verteilungsfunktion dieser Statistik ist die Stichprobenverteilung. Die Standardabweichung der Statistik nennt man den Standardfehler.

Die Stichprobenverteilung wird für viele statistische Prüfverfahren berechnet und mit einer Referenzverteilung verglichen. Aus diesem Vergleich wird dann meistens die statistische Signifikanz berechnet. Deswegen erfordern parametrische statistische Verfahren meist auch, dass gewisse Parameter normalverteilt sind.

Stichprobenverteilung des Mittelwerts

Gehen wir davon aus, dass wir aus unserer Grundgesamtheit N alle möglichen Stichproben der Größe n ziehen und jede Stichprobe den Mittelwert berechnen. Auf diese Art und Weise berechnen wir die Stichprobenverteilung des Mittelwerts.

Unsere Stichprobenverteilung hat viele Gemeinsamkeiten mit der Verteilungsfunktion der Grundgesamtheit. Zum einen entspricht der Mittelwert der Stichprobenverteilung \(\mu_{\bar{x}}\) dem Mittelwert der Grundgesamtheit \(\mu\). Der Standardfehler des Mittelwerts ist die Standardabweichung der Stichprobenverteilung des Mittelwerts, \(\sigma_{\bar{x}}\).

Zentraler Grenzwertsatz

Der Zentrale Grenzwertsatz besagt, dass die Stichprobenverteilung des Mittelwerts für jede unabhängige Zufallsvariable normalverteilt (bzw. fast normalverteilt) sein wird, wenn die Stichprobengröße groß genug ist. Allerdings ist „groß genug“ ein relativer Begriff. Der zentrale Grenzwertsatz ist, wie der Name schon sagt, ein Grenzwertsatz und macht damit diese Aussage für unendlich große Stichproben. Generell lassen sich allerdings zwei Dinge über die Größe sagen:

  1. Die Verteilungsfunktion der Grundgesamtheit. Wenn die Grundgesamtheit selbst quasi-normalverteilt ist, dann genügt bereits eine kleinere Stichprobe, damit die Stichprobenverteilung des Mittelwerts ebenfalls normalverteilt ist.
  2. Genauigkeit. Je stärker die Stichprobenverteilung des Mittelwerts normalverteilt sein soll, desto größer muss die Stichprobe sein.
  3. Normalverteilung der Grundgesamtheit. Ist die Grundgesamtheit, aus der die Stichprobe entnommen wurde, normalverteilt, wird die Stichprobe ebenfalls normalverteilt sein.

Dies ist auch der Grund, weshalb man oft die Daumenregel n = 30 als Empfehlung liest. Bei n = 30 geht man davon aus, dass die Stichprobenverteilung des Mittelwerts etwa normalverteilt sein wird. Hat man allerdings eine Stichprobe der Größe 30 bedeutet dies nicht, dass die Stichprobenverteilung der Mittelwerte automatisch normalverteilt sein wird. Allerdings zeigen etliche Simulationsstudien auch, dass viele parametrische statistische Verfahren durchaus robust gegenüber der Verletzung der Normalverteilungsannahme sind.