Mixed ANOVA

Mixed ANOVA: Auf Ausreißer prüfen

Ausreißer sind eine weitere mögliche Quelle für Verzerrungen bei statistischen Analysen. Der Einfachheit halber, können wir uns die mixed ANOVA wie einen ungepaarten t-Test vorstellen – die Konsequenzen von Ausreißern sind dieselben für beide Verfahren. Der t-Test verwendet nicht nur den Mittelwert, sondern aus die Standardabweichung für die Berechnung des t-Werts und damit auch für die Berechnung der Signifikanz (p-Wert).

Damit ein t-Test (und auch eine mixed ANOVA) schnell signifikant wird, muss der Unterschied zwischen den Gruppen möglichst groß sein, die Varianz bzw. Standardabweichung innerhalb der Gruppen aber klein. Beispielhaft können wir uns eine Studie mit einem neuen blutdrucksenkenden Medikament vorstellen: Am Anfang wählen wir Patienten anhand ihres Bluthochdrucks aus. Wir haben damit eine relativ homogene Gruppe mit Personen, deren Blutdruck innerhalb eines gewissen Bereichs liegt (geringe Varianz). Unser Ziel ist es, den Blutdruck möglichst weit zu senken – und das für alle Personen etwa im selben Maß. Damit hätten wir wieder eine Gruppe von Personen mit einem relativ homogenen Blutdruck – aber geringer als noch zuvor. Würden unsere Messungen so ausfallen, würden wir mit hoher Sicherheit ein signifikantes Ergebnis erhalten.

Anders wäre es, wenn unser Medikament den Blutdruck nur bei manchen Personen senken würde, bei einigen vielleicht gar nicht und es bei anderen sogar die umgekehrte Wirkung hätte und den Blutdruck erhöhen würde. In diesem Fall wäre die Varianz bei der zweiten Messung hoch und damit auch der Fehler der Messung. In diesem Fall würden wir kein signifikantes Ergebnis erwarten.

Ausreißer für die mixed ANOVA mit SPSS überprüfen

Um unsere Daten auf mögliche Ausreißer hin zu überprüfen, erstellen wir ein Box-Plot, mit allen Stufen unserer abhängigen Variablen.

  1. Das Dialogfenster für die Box-Plots findet sich in Grafik > Alte Dialogfelder > Boxplot…

    Es gibt zwar auch die Möglichkeit die Boxplots über die neuen Dialogfelder zu erstellen, allerdings geht es mit den alten Feldern schneller ;-)

    Boxplot im SPSS Menü


  2. Es öffnet sich noch dieses Dialogfenster.

    Boxplot Dialogfenster


  3. Hier wählen wir Gruppiert und ausgewähltes KontrollkästchenAuswertung über verschiedene Variablen

    Boxplot Dialogfenster (ausgewählt)


  4. Mit einem Klick auf Definieren geht es weiter.

  5. Jetzt sind wir im eigentlichen Dialogfenster. Hier können wir SPSS sagen, welche Variablen wir gerne auf Ausreißer untersuchen lassen wollen. Diese Variablen sind unsere Abhängige Variablen. Wir tragen sie in das entsprechende Feld ein indem wir sie selektieren und auf drücken. Alternativ können wir sie auch per Drag-and-Drop in das Feld ziehen. Die Variable nominalskalierte Variablegruppe ist unser Faktor, daher tragen wir ihn unter Kategorieachse ein.

    Falls wir noch eine Variable haben, die unseren Fällen einen besseren Namen gibt als die fortlaufende Nummerierung von SPSS, können wir diese bei Fallbeschriftung eintragen.

    Die Fallbeschriftung ist allerdings optional und dient lediglich der einfacheren Zuordnung bei der späteren Auswertung.

    Boxplot Dialog Variablen


  6. Für unseren Beispieldatensatz würde das ausgefüllte Dialogfenster so aussehen:

    Boxplot Dialog Variablen (ausgefüllt)


  7. Mit einem Klick auf OK erstellen wir den Box-Plot.

  8. Jeder Datenpunkt, der mehr als 1,5 Standardabweichungen vom Mittelwert entfernt ist, wird durch einen Kreis, zusammen mit der Fallnummer auf dem Boxplot markiert. Diese Kreise gelten als leichte Ausreißer. Werte, die mehr als 3 Standardabweichungen vom Mittelwert entfernt sind, werden mit einem Sternchen (∗) gesondert markiert, wie im Beispiel unterhalb. Solche Ausreißer gelten als extreme Ausreißer. Unser Datensatz enthält drei leichte Ausreißer (Fallnummern 3, 18 und 40).

    Mixed ANOVA: Boxplot Ausreißer Ausgabe


Was tun mit Ausreißern?

Wenn unsere Daten Ausreißer enthalten, haben wir einige Möglichkeiten, wie wir weiter machen.

  1. Ausreißer in dem Datensatz lassen
  2. Die Versuchsperson von der weiteren Analyse ausschließen
  3. Der Wert durch einen anderen, weniger extremen Wert ersetzen
  4. Systematisch die höchsten und niedrigsten Werte aus dem Datensatz entfernen (Winsorizing und Trimming)