Multiple Lineare Regression

Multiple lineare Regression Voraussetzung #1: Lineare Beziehung zwischen den Variablen

Multiple lineare Regression kann – wie der Name schon sagt – nur eine lineare Beziehung zwischen den beteiligten Variablen finden. Ist die Beziehung nicht linear, sondern beispielsweise kubisch, wird die lineare Regression die Stärke des Zusammenhangs unterschätzen.

Lineare Beziehung in SPSS überprüfen

Es existieren verschiedene Methoden, Linearität zu überprüfen. Sie alle haben Ihre Vor- und Nachteile. Neben grafischen Methoden, wie wir sie hier verwenden, existieren auch statistische Testverfahren (beispielsweise basierend auf der CUSUM-Statistik und dem Kolmogorov-Smirnov-Test). Auch SPSS hat einen Linearitätstest, den unter Analysieren > Mittelwerte vergleichen > Mittelwerte aufgerufen werden kann.

In SPSS können wir diese Voraussetzungen einfach überprüfen, indem wir die studentisierten Residuen (neu berechnete Variable SRE_1) gegen die unstandardisierte neu vorhergesagte Variable (in unserem Beispiel PRE_1) in einem Streudiagramm auftragen.

  1. Um ein Streudiagramm zu erstellen wählen wir unter Grafik > Alte Dialogfelder > Streu-/Punktdiagramm aus.

    Multiple Regression: Streudiagramm Menü

    Es gibt zwar noch andere Möglichkeiten, ein Streudiagramm mit SPSS zu erstellen, wir bevorzugen allerdings die alten Dialogfelder, da sie es erlauben, ein Streudiagramm mit den wenigsten Schritten zu erstellen.

  2. Es erscheint das folgende Dialogfeld. Hier wählen wir die erste Option, Einfaches Streudiagramm, aus. Mit einem Klick auf Definieren bestätigen wir.

    Korrelation: Linearität bestimmen #1: Auswahl treffen


  3. In dem Dialog, der dann erscheint,…

    Mutiple Regression: Streudiagramm Dialog


  4. …tragen wir auf der einen Achse die unstandardisierten vorhersagten Werte (PRE_1) und auf der anderen Achse die studentisierten Residuen (SRE_1) ein. Die Interpretation ist einfacher, wenn wir SRE_1 auf der y-Achse auftragen und PRE_1 auf der x-Achse.


  5. Mit einem Klick auf OK erstellen wir unser Diagramm.

  6. In der Ausgabe finden wir das unterstehende Diagramm.


Interpretation

Das Punkte im Diagramm sollten etwa um die Nulllinie (y = 0) herum verlaufen, wie im unserem Beispieldiagramm.

Wir sollten jedoch nicht vergessen, dass die Interpretation dieser Diagramme subjektiv ist. Viele, die sich zum ersten Mal mit der Residualanalyse befassen, neigen dazu, diese Diagramme zu überinterpretieren und jede Abweichung als potenziell problematisch zu betrachten. Wir sollten vor allem vorsichtig sein, wenn wir Residuendiagrammen für sehr kleine Datensätze berechnen. Hier kann es sein, dass einfach zu wenige Daten vorhanden sind, als das man aussagekräftige Schlussfolgerungen ziehen könnte.

Partielle Regressionsdiagramme

Alternativ können wir auch die partiellen Regressionsdiagramme untersuchen. Hier sollte die Beziehung zwischen den Variablen in den partiellen Regressionsdiagrammen linear sein. Kategoriale Prädiktoren, wir geschlecht, müssen nicht überprüft werden.

Unser Beispieldatensatz hat zwei kontinuierliche Prädiktoren: erfahrung und ausbildung, welche die beiden Diagramme unten produziert haben:

Multiple Regression: partielles Regressionsdiagramm für Erfahrung

Im Diagramm links ist praktisch keine Beziehung zwischen den Variablen zu erkennen. Im Diagramm rechts hingegen ist ein positiver linearer Trend zu beobachten.

 

Was tun wenn...

Wenn wir keine lineare Beziehung zwischen den Variablen haben, könnten wir die Prädiktoren oder das Kriterium oder beide transformieren. Allerdings: Nicht jede non-lineare Beziehung lässt sich linearisieren.