Einfaktorielle MANOVA: Voraussetzung #4: Multivariate Ausreißer finden
In einem vorherigen Schritt haben wir schon nach univariaten Ausreißern geschaut. In diesem Schritt schauen wir nach multivariaten Ausreißern. Dies ist eine spezielle Voraussetzung von verschiedenen multivariaten statistischen Verfahren, wie der MANOVA.
Im Gegensatz zu univariaten Ausreißern sind multivariate Ausreißer sind nicht unbedingt durch extrem hohe oder niedrige Werte entlang einzelner Variablen gekennzeichnet. Um sie zu erkennen, muss man alle abhängigen Variablen zusammen betrachten.
Eine Möglichkeit, multivariate Ausreißer in SPSS zu bestimmen, ist die Mahalanobis Distanz. Um sie in SPSS zu berechnen, müssen wir eine Regression durchführen, wie wir es in diesem Abschnitt besprechen werden.
Mahalanobis Distanz in SPSS berechnen
- Zuerst gehen wir zu Analysieren > Regression > Linear…
- Es öffnet sich das Dialogfenster unten.
- Hier tragen wir unsere abhängigen Variablen als die unabhängigen Variablen (Prädiktoren) der Regression ein. In unserem Fall sind das Zufriedenheit und Ergebnis. Im Feld Abhängige Variable der Regression tragen wir die Laufvariable VP ein. Für unseren Beispieldatensatz sähe das ausgefüllte Dialogfenster wie in der Abbildung unterhalb aus.
Wir können als Abhängige Variable irgendeine der übrigen Variablen einfügen. Wichtig ist, dass die Variable in keiner Gruppe nur jeweils gleiche Werte hat. Das würde zu einer Fehlermeldung führen. Für die eigentliche Berechnung der Mahalanobis-Distanz werden nur die unabhängigen Variablen verwendet.
- Die Mahalanobis-Distanz wird als separate Variable gespeichert. Damit SPSS dies für uns tut, drücken wir auf
- Es erscheint das Dialogfenster unterhalb.
- Hier wählen wir unter Distanzen den ersten Eintrag, , aus und bestätigen unsere Auswahl mit einem klick auf .
- Zuletzt drücken wir auf , um die Regression auszuführen und die Mahalanobis-Distanz berechnen zu lassen.
- In der Datenansicht sehen wir, dass eine neue Variable hinzugefügt wurde: MAH_1. Sie entspricht der Mahalanobis-Distanz für jeden Fall.
Im nächsten Schrittinterpretieren wir die Distanzen und schauen, ob unser Datensatz Ausreißer enthält.