Einfaktorielle ANCOVA: Voraussetzungen
Insgesamt acht Voraussetzungen sind zu erfüllen, damit wir eine einfaktorielle ANCOVA berechnen dürfen. Allerdings sind nicht alle Punkte, die wir nachfolgend nennen werden, strikte Voraussetzung. Manche von ihnen lassen sich biegen, ohne das unser Testergebnis stark verfälscht wird, andere wiederum müssen eingehalten werden.
Die ersten vier Voraussetzung aus der Liste sind Grundvoraussetzungen; sie können nicht mit Statistikprogrammen überprüft werden, müssen aber dennoch erfüllt sein. Die letzten vier Punkte wiederum werden wir auf den kommenden Seiten im Detail und schrittweise mit SPSS überprüfen.
- Unabhängigkeit der Messungen. Dies ist eine der wichtigsten Voraussetzungen der einfaktoriellen ANCOVA. Messungen sind dann unabhängig, wenn der Messwert einer Gruppe nicht abhängt oder beeinflusst wird durch den Messwert aus einer anderen Gruppe. Gewinnt man seine Messdaten von Menschen, ist diese Bedingung meistens bereits erfüllt, wenn kein Teilnehmer aus einer Gruppe auch in einer anderen Gruppe vorkommt. Daher befinden sich in jeder Gruppe unterschiedliche Personen. Auch wenn man Personen nach Geschlecht, Alter oder Bildungsabschluss aufteilt, wären die Personen in jeder Gruppe ebenfalls andere und die Voraussetzung damit erfüllt.
Hat man allerdings ein Versuchsdesign bei dem dieselbe Person mehrmals gemessen wurde, sollte man eher zu einer einfaktoriellen ANCOVA mit Messwiederholung greifen. - Die abhängige Variable ist mindestens intervallskaliert. Das Skalenniveau ist wichtig, da die Formel der ANCOVA vorsieht, dass wir verschiedene mathematische Operationen durchführen, die wir erst ab einer intervallskalierten Variablen durchführen dürfen. Beispiele für intervallskalierte Variablen sind: Zeit (z.B. Alter, Reaktionszeiten, Zeitmessungen), Größe, Gewicht, Temperatur, Geld, IQ, Anzahl von … (z.B. Studenten, Kaffee pro Tag), Konzentrationen (z.B. Hormone, Mineralien, Eiweiße).
- Die unabhängige Variable ist unabhängig und nominalskaliert. Wir erwarten, dass unsere unabhängige Variable kategorial ist, daher nominalskaliert. Die Einteilung kann auf natürliche Weise zustande gekommen sein (wie beispielsweise bei Geschlecht) oder künstlich (wie beispielsweise die Einteilung in verschiedene Altersgruppen). Wichtig ist allerdings, dass die Gruppen unabhängig voneinander sind.
- Die Kovariate(n) sind mindestens intervallskaliert. Auch die Kovariate muss mindestens intervallskaliert sein. Eine Kovariate ist im Prinzip nichts anderes als eine weitere Variable die in das Modell aufgenommen wird. Genau genommen, ist die ANCOVA eine Form von multipler linearer hierarchischer Regression und die Kovariate in diesem Kontext ein weiterer Prädiktor und wie auch in der Regression müssen Prädiktoren mindestens intervallskaliert sein (diesen Zusammenhang besprechen wir ausführlicher in einem methodischen Ausflug hier).
Möchte man eine weitere Variable in das Modell aufnehmen, die ebenfalls kategorial ist, könnte man sie als weiteren Faktor aufnehmen und aus der einfaktoriellen ANCOVA eine zweifaktorielle ANCOVA machen. - Homogenität der Regressionssteigungen sollte vorliegen. Wenn sich die Gruppen in Bezug auf die Kovariate signifikant unterscheiden (also eine Interaktion vorliegt), wird die Aufnahme der Kovariate in die Analyse diese Unterschiede zwischen den Gruppen nicht „kontrollieren“ oder „ausgleichen“. Dies würde darauf hindeuten, dass die Unterschiede in der abhängigen Variable zwischen den Gruppen in Abhängigkeit von der Kovariate variieren und die Ergebnisse aus einer ANCOVA nicht aussagekräftig sein werden. Je mehr diese Annahme verletzt wird, desto wahrscheinlicher ist es, dass wir die Nullhypothese nicht zurückweisen können (Fehler zweiter Art). Dies bedeutet, dass ein signifikanter Zusammenhang besteht, aber als nicht signifikant angezeigt wird, so dass wir die Nullhypothesen nicht verwerfen können. Diese Voraussetzung werden wir durch die Bildung des Interaktionsterms in einem angepassten ANCOVA-Modell mit SPSS statistisch überprüfen.
- Es befinden sich keine Ausreißer in den Gruppen. Die meisten parametrischen Statistiken sind nur wenig robust gegenüber Ausreißern, also Werte die sich weit entfernt von der Masse der anderen Werten befinden. Ein einziger Ausreißer kann bereits ein sonst signifikantes Ergebnis nicht signifikant werden lassen. Daher ist es besonders wichtig, die Daten auf Ausreißer zu überprüfen.
- Die Residuen sind (etwa) normalverteilt. Als parametrisches Verfahren liefert die einfaktorielle ANCOVA die am besten zu interpretierenden Ergebnisse, wenn die Residuen etwa normalverteilt ist. Die Residuen sind einfach die Fehlerterme bzw. die Differenzen zwischen dem beobachteten Wert der abhängigen Variable und dem vorhergesagten Wert. Wie man dies Überprüft und was man tut, wenn die Residuen nicht normalverteilt sind, zeigen wir im weiteren Verlauf.
- Die Varianzen in jeder Gruppe sollten (etwa) gleich sein (Homoskedastizität). Die Varianz spielt eine große Rolle bei der ANCOVA (immerhin steht das V in ANCOVA für Varianz). Liegen die Varianzen der einzelnen Gruppe zu weit voneinander entfernt, erhöht sich die Wahrscheinlichkeit, einen Fehler erster Art zu begehen. Allerdings gibt es auch hier Korrekturmöglichkeiten, sollte diese Voraussetzung nicht erfüllt sein.
Zurück
Einfaktorielle ANCOVA: Beispieldatensatz
Weiter
Einfaktorielle ANCOVA: Homogenität der Regressionssteigungen