Einfaktorielle ANOVA

einfaktorielle ANOVA: Deskriptive Statistiken interpretieren

Wir haben bereits zwei der drei Voraussetzungen überprüft – lediglich die Varianzhomogenität (Homoskedastizität) wurde noch nicht überprüft. Wir werden allerdings zuerst die deskriptiven Statistiken interpretieren, denn, anders als bei Ausreißern oder möglichen Verletzungen der Normalverteilungsannahme, würde ein Mangel an Varianzhomogenität die deskriptiven Statistiken nicht verändern.

Teil der Ausgabe von SPSS sind die ONEWAY deskriptiven Statistiken, die SPSS für die einfaktorielle ANOVA generiert.

einfaktorielle ANOVA deskriptive Statistiken

Für jede Stufe des Faktors nominalskalierte Variablegruppe erhalten wir eine eigene Zeile in der Tabelle mit Statistiken für die abhängige Variable intervallskalierte Variablebdi, die sich jeweils nur auf diese eine Gruppe bezieht, sowie eine Zeile Gesamt, mit Statistiken für den gesamten Datensatz. SPSS berechnet die folgenden deskriptiven Statistiken:

  • [Spalte links, keine Bezeichnung]: Name der Faktorstufe
  • N: Anzahl der Datensätze in der Faktorstufe
  • Mittelwert: arithmetisches Mittel
  • Standardabweichung: Standardabweichung
  • Standardfehler: Standardfehler
  • Untergrenze: Untergrenze des 95%-Konfidenzintervalls (für den Mittelwert)
  • Obergrenze: Obergrenze des 95%-Konfidenzintervalls (für den Mittelwert)
  • Minimum: kleinster Wert in der Gruppe
  • Maximum: größter Wert in der Gruppe

Anhand dieser Tabelle können wir grundlegende Informationen über unsere Daten erhalten. Zum einen sagt uns das N, ob die Gruppengröße gleich ist oder nicht. Über die Spalte Mittelwert können wir sehen, ob unsere Daten einem Trend folgen oder nicht. Die Standardabweichung gibt Aufschluss über die Streuung unserer Daten. Dieser Wert wird zusammen mit dem Mittelwert verwendet, um die Signifikanz zu überprüfen. Das 95%-Konfidenzintervall gibt uns Aufschluss über die Güte unserer Messung.

Für unser Beispiel können wir sehen, dass die Gruppengröße für alle Faktorstufen gleich ist (N = 30). Ausgehend vom Mittelwert ergibt sich auch ein klarer Trend: je höher die körperliche Aktivität, desto geringer der Depressionsscore (gemessen durch den BDI). Die Standardabweichung von den Gruppen ist etwa gleich, allerdings geringer für die Gruppe geringe körperliche Aktivität.

Der besprochene Trend zeigt sich auch im Diagramm wieder:

einfaktorielle ANOVA: Deskriptive Statistiken als Diagramm

Auch wenn dieses Diagramm die Mittelwerte nach Gruppen darstellt, hat es zahlreiche Probleme:

  1. die y-Achse fängt in der Regel nicht bei Null an, was die Darstellung verbessert, aber den Unterschied zwischen den Gruppen überproportional größer darstellt, als er tatsächlich ist.
  2. Das Diagramm enthält keine Fehlerbalken, was wichtig für die Interpretation der Ergebnisse ist, wie wir noch später besprechen werden.
  3. Es handelt sich bei dem Diagramm immer um ein Liniendiagramm. Liniendiagramme geben den Anschein eines zeitlichen Verlaufs bzw. eines Zusammenhangs der Gruppen. Die einfaktorielle ANOVA testet allerdings die Unterschiede immer zwischen unabhängigen Gruppen, was von dem Diagramm nicht ausreichend dargestellt wird. Hier wäre es oft besser eine andere Diagrammart zu wählen, wie beispielsweise ein Balkendiagramm.

Ergebnisse Verschriftlichen

Um diese Werte zu Verschriftlichen benötigen wir den Mittelwert und die Standardabweichung aus der Tabelle der deskriptiven Statistiken:

Deutsch
Der Schweregrad der Depression, gemessen durch den BDI, nahm ab, von geringer Aktivität (M = 28.87, SD = 4.97), zu moderater Aktivität (M = 21.00, SD = 6.11) zu hoher körperlicher Aktivität (M = 9.70, SD = 6.71).
English
The level of depression (as measured by the BDI) decreased from low activity (M = 28.87, SD = 4.97), to moderate activity (M = 21.00, SD = 6.11), to high activity (M = 9.70, SD = 6.71).
Nach APA werden Zahlen (außer p-Werte) auf zwei Nachkommastellen gerundet. Moderate körperliche Aktivität hat einen Mittelwert von 21.00. Auch wenn wir dies als 21 schreiben könnten, wären beide Zahlen von der Aussage her nicht identisch: 21.00 sagt explizit, dass wir auf zwei Nachkommastellen gerundet haben und die beide Null waren.