Mixed ANOVA: Auf Ausreißer prüfen
Ausreißer sind eine weitere mögliche Quelle für Verzerrungen bei statistischen Analysen. Der Einfachheit halber, können wir uns die mixed ANOVA wie einen ungepaarten t-Test vorstellen – die Konsequenzen von Ausreißern sind dieselben für beide Verfahren. Der t-Test verwendet nicht nur den Mittelwert, sondern auch die Standardabweichung für die Berechnung des t-Werts und damit auch für die Berechnung der Signifikanz (p-Wert).
Damit ein t-Test (und auch eine mixed ANOVA) schnell signifikant wird, muss der Unterschied zwischen den Gruppen möglichst groß sein, die Varianz bzw. Standardabweichung innerhalb der Gruppen aber klein. Beispielhaft können wir uns eine Studie mit einem neuen blutdrucksenkenden Medikament vorstellen: Am Anfang wählen wir Patienten anhand ihres Bluthochdrucks aus. Wir haben damit eine relativ homogene Gruppe mit Personen, deren Blutdruck innerhalb eines gewissen Bereichs liegt (geringe Varianz). Unser Ziel ist es, den Blutdruck möglichst weit zu senken – und das für alle Personen etwa im selben Maß. Damit hätten wir wieder eine Gruppe von Personen mit einem relativ homogenen Blutdruck – aber geringer als noch zuvor. Würden unsere Messungen so ausfallen, würden wir mit hoher Sicherheit ein signifikantes Ergebnis erhalten.
Anders wäre es, wenn unser Medikament den Blutdruck nur bei manchen Personen senken würde, bei einigen vielleicht gar nicht und es bei anderen sogar die umgekehrte Wirkung hätte und den Blutdruck erhöhen würde. In diesem Fall wäre die Varianz bei der zweiten Messung hoch und damit auch der Fehler der Messung. In diesem Fall würden wir kein signifikantes Ergebnis erwarten.
Ausreißer für die mixed ANOVA mit SPSS überprüfen
Um unsere Daten auf mögliche Ausreißer hin zu überprüfen, erstellen wir ein Box-Plot, mit allen Stufen unserer abhängigen Variablen.
- Das Dialogfenster für die Box-Plots findet sich in Grafik > Alte Dialogfelder > Boxplot…
Es gibt zwar auch die Möglichkeit die Boxplots über die neuen Dialogfelder zu erstellen, allerdings geht es mit den alten Feldern schneller
- Es öffnet sich noch dieses Dialogfenster.
- Hier wählen wir Gruppiert und
- Mit einem Klick auf geht es weiter.
- Jetzt sind wir im eigentlichen Dialogfenster. Hier können wir SPSS sagen, welche Variablen wir gerne auf Ausreißer untersuchen lassen wollen. Diese Variablen sind unsere Abhängige Variablen. Wir tragen sie in das entsprechende Feld ein indem wir sie selektieren und auf drücken. Alternativ können wir sie auch per Drag-and-Drop in das Feld ziehen. Die Variable gruppe ist unser Faktor, daher tragen wir ihn unter Kategorieachse ein.
Falls wir noch eine Variable haben, die unseren Fällen einen besseren Namen gibt als die fortlaufende Nummerierung von SPSS, können wir diese bei Fallbeschriftung eintragen.
Die Fallbeschriftung ist allerdings optional und dient lediglich der einfacheren Zuordnung bei der späteren Auswertung. - Für unseren Beispieldatensatz würde das ausgefüllte Dialogfenster so aussehen:
- Mit einem Klick auf erstellen wir den Box-Plot.
- Jeder Datenpunkt, der mehr als das 1,5-Fache des Interquartilsabstands ist, wird durch einen Kreis, zusammen mit der Fallnummer auf dem Boxplot markiert. Diese Kreise gelten als leichte Ausreißer. Werte, die mehr als 3-Fache des Interquartilsabstands sind, werden mit einem Sternchen (∗) gesondert markiert, wie im Beispiel unterhalb. Solche Ausreißer gelten als extreme Ausreißer. Unser Datensatz enthält drei leichte Ausreißer (Fallnummern 3, 18 und 40).
Da unser Datensatz nur leichte Ausreißer enthält, entschließen wir uns, alle Fälle unverändert auszuwerten und keine Fälle auszuschließen.
Was tun mit Ausreißern?
Wenn unsere Daten Ausreißer enthalten, haben wir einige Möglichkeiten, wie wir weiter machen.- Ausreißer in dem Datensatz lassen und mit der weiteren Analyse fortfahren
- Die Versuchsperson von der weiteren Analyse ausschließen
- Systematisch die höchsten und niedrigsten Werte aus dem Datensatz entfernen (Winsorizing und Trimming)