Mixed ANOVA

Mixed ANOVA: Normalverteilung interpretieren

SPSS bietet mehrere Möglichkeiten, Variablen auf Normalverteilung zu überprüfen. Neben visuellen Methoden (Q-Q Plots), berechnet SPSS auch noch zwei statistische Tests: den Kolmogorow-Smirnow-Test und den Shapiro-Wilk-Test. Wir werden in diesem Teil den Shapiro-Wilk-Test auswerten, da er gegenüber dem Kolmogorow-Smirnow-Test eine deutlich höhere statistisch Power hat (die Fähigkeit, die Abweichung von der Normalverteilung korrekt zu betimmen; Razali & Wah, 2011; Steinskog, Tjøstheim & Kvamstø, 2007).

Shapiro-Wilk-Test

SPSS produziert im Anschluss an die explorative Datenanalyse eine relativ lange Ausgabe. In dieser ist für uns die Tabelle der Tests auf Normalverteilung von Interesse.

  1. Unterhalb sehen wir die Ausgabe der Tests auf Normalverteilung für unseren Beispieldatensatz für die einfaktorielle ANOVA.

    Mixed ANOVA: SPSS Ausgabe der Prüfung auf Normalverteilung


  2. Da wir gruppe als Faktor angegeben hatten, erhalten wir eine getrennte Ausgabe für alle drei Faktorstufen unseres Faktors, für alle zehn Messungen, also insgesamt 30 Gruppen, die auf Normalverteilung überprüft werden. SPSS berechnet für uns sowohl den Kolmogorov-Smirnov-Test als auch den Shapiro-Wilk-Test. Die Spalte Signifikanz (unten gelb markiert) ist für uns interessant. Ist der Wert hier kleiner als .05, gehen wir davon aus, dass die Daten nicht normalverteilt sind. Wenn die Annahme der Normalverteilung nicht verletzt wurde (= die Daten sind etwa normalverteilt), wird die Spalte Signifikanz hingegen einen Wert von p > .05 haben.

    Mixed ANOVA: SPSS Ausgabe der Prüfung auf Normalverteilung (Signifikanz hervorgehoben)


In unserem Beispieldatensatz erfüllt eine Gruppe die Voraussetzung der Normalverteilung nicht: T6 für die Experimentalgruppe 2 (neues Medikament).

Wenn eine oder mehrere Variablen nicht normalverteilt sind, erhöht sich die Wahrscheinlichkeit eines falsch-positiven Ergebnisses, wenn die Daten mit einer ANOVA oder einem anderen Test analysiert werden, der normalverteilte Daten annimmt. Generell gelten ANOVA-Modelle allerdings relativ robust gegenüber Verletzungen der Annahme normalverteilter Daten, vor allem bei moderaten Verletzungen oder wenn die Stichprobengröße entsprechend groß ist. In unserem Fall ist eine Gruppe nicht normalverteilt, was wir in Kauf nehmen und mit der weiteren Analyse fortfahren, ohne weitere Maßnahmen zu ergreifen.

Die Abweichung der T6 der Experimentalgruppe mit dem neuen Medikament von der Annahme der Normalverteilung könnten wir wie folgt berichten:

Deutsch
BDI-Werte waren für alle Gruppen – bis auf T4 der Experimentalgruppe – normalverteilt, wie eine Überprüfung mit dem Shapiro-Wilk-Test ergab (p > .05)
English
BDI was normally distributed for all groups except for T6 of the experimental group using the novel , as assessed by the Shapiro-Wilk test (p > .05).

Wären alle Gruppen hingegen normalverteilt gewesen, hätten wir dies so berichten können:

Deutsch
BDI-Werte waren für alle Gruppen normalverteilt, wie eine Überprüfung mit dem Shapiro-Wilk-Test ergab (p > .05)
English
BDI was normally distributed for all groups, as assessed by the Shapiro-Wilk test (p > .05).
Da wir mehr als 30 Personen pro Gruppe haben, hätten wir auch die Normalverteilung der Stichprobenverteilung annehmen können, ohne diese Annahme separat zu überprüfen.
 

Normalverteilung verletzt?!

Sollte eine oder mehrere Gruppen nicht normalverteilt sein, existieren zwei Optionen, wie wir fortfahren können.

  1. Eine Transformation anwenden
  2. Mit den Daten fortfahren, ohne Maßnahmen anzuwenden

Bei Analysen mit mehr als 30 Versuchspersonen können wir auf die Überprüfung der Normalverteilung verzichten und davon ausgehen, dass nach dem zentralen Grenzwertsatz die Stichprobenverteilung annähernd normalverteilt sein wird (Kähler, 2004; Bortz & Schuster, 2010; Tavakoli, 2013).

Literaturverzeichnis

  1. Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7., vollständig überarbeitete und erweiterte Auflage). Springer-Lehrbuch. Berlin, Heidelberg: Springer-Verlag Berlin Heidelberg.
  2. Kähler, W.-M. (2004). Statistische Datenanalyse: Verfahren verstehen und mit SPSS gekonnt einsetzen (3., völlig neubearbeitete Auflage). Wiesbaden: Vieweg+Teubner Verlag.
  3. Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics2(1), 21-33.
  4. Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika52(3/4), 591-611.
  5. Steinskog, D. J., Tjøstheim, D. B., & Kvamstø, N. G. (2007). A cautionary note on the use of the Kolmogorov-Smirnov test for normality. Monthly Weather Review135(3), 1151-1157.
  6. Tavakoli, H. (2013). A dictionary of research methodology and statistics in applied linguistics. Tehran: Rahnamā.