Einfaktorielle MANOVA

Einfaktorielle MANOVA: Voraussetzung #1: Univariate Ausreißer finden

Teil der explorativen Datenanalyse sind Box-Plots, mit denen wir unsere Daten auf univariate Ausreißer hin überprüfen können. Für jede abhängige Variable in jeder Faktorstufe wird dabei ein separater Box-Plots erstellt.

Box-Plots interpretieren

Für unseren Beispieldatensatz erhalten wir folgendes Diagramm:

Einfaktorielle MANOVA: Box-Plot

Jeder Datenpunkt, der mehr als das 1,5-Fache des Interquartilsabstands ist, wird durch einen Kreis, zusammen mit der Fallnummer, auf dem Boxplot markiert. Diese Kreise gelten als leichte Ausreißer. Werte, die mehr als 3-Fache des Interquartilsabstands sind, werden mit einem Sternchen (∗) gesondert markiert, wie im Beispiel unterhalb. Solche Ausreißer gelten als extreme Ausreißer. Unser Datensatz enthält insgesamt zehn leichte Ausreißer.

Da unser Datensatz nur leichte Ausreißer enthält, entschließen wir uns, alle Fälle unverändert auszuwerten und keine Fälle auszuschließen.

Ausreißer sollten nicht einfach so von der weiteren Analyse ausgeschlossen werden. Bei jedem Ausschluss von Fällen sollten Vor- und Nachteile gegeneinander abgewogen werden. Zwar können Ausreißer Inferenzstatistiken verzerren, aber das Ausmaß hängt auch stark von dem Verfahren und der schwere des Ausreißers ab. Jeder Ausschluss eines Falls aus der Gesamtstichprobe geht aber immer mit einem Verlust an Power einher (durch die Verringerte Stichprobengröße) und noch vielmehr schließen wir Fälle aus, die uns potentiell ebenfalls wichtige Einblicke bringen können. Jeder Ausschluss sollte daher nicht pauschal, sondern mit Hinblick auf die Fragestellung erfolgen.

Berichten der Ergebnisse

Die Ausreißer in unserem Datensatz sind alle leichte Ausreißer. Wir lassen sie in der Analyse. Wir könnten dies wie folgt berichten:
Deutsch
Im Datensatz befanden sich keine Ausreißer.
English
There were no outliers in the data.

Hätten wir uns dazu entschlossen die Ausreißer von der weiteren Datenauswertung auszuschließen, hätten wir das so schreiben können:

Deutsch
Aufgrund von extremen Werten wurden zehn Teilnehmer von der weiteren Datenauswertung ausgeschlossen.
English
Ten participants were excluded from further analysis due to extreme values.