Produkt-Moment-Korrelation

Pearson Produkt-Moment-Korrelation: Linearität überprüfen

Die Pearson Produkt-Moment-Korrelation ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen. Auch wenn ein starker Zusammenhang besteht: Ist ein Zusammenhang nicht linear, wird die Korrelation ihn unterschätzen. In solchen Fällen sollten Transformationen oder andere Verfahren verwendet werden.

Die einfachste Methode, die Art des Zusammenhangs zu bestimmen, ist, sich die Daten in einem Streudiagramm (Scatterplot) anzuschauen. Alle Daten in den Diagrammen unterhalb haben ein Muster, das den Daten zugrunde liegt. Bei den ersten beiden Diagrammen (nicht-linearer Zusammenhang) würde die Produkt-Moment-Korrelation keinen Zusammenhang finden, auch wenn wir ein klares Muster sehen können. Bei den unteren beiden Diagrammen ist der Zusammenhang linear bzw. monoton. Die Produkt-Moment-Korrelation wird hier korrekterweise einen starken Zusammenhang feststellen können

Nicht-linearer Zusammenhang

Linearer bzw. monotoner Zusammenhang

Linearität mit SPSS überprüfen: Methode #1

Die einfachste Methode, die Art des Zusammenhangs zu bestimmen, ist ein Streudiagramm mit den Daten zu erstellen. Diese Alternative eignet sich vor allem mit kleineren Datensätzen (bis etwa 1000 Fälle).

  1. Um ein Streudiagramm zu erstellen wählen wir unter Grafik > Alte Dialogfelder > Streu-/Punktdiagramm aus.

    Es gibt zwar noch andere Möglichkeiten, ein Streudiagramm mit SPSS zu erstellen, wir bevorzugen allerdings die alten Dialogfelder, da sie es erlauben, ein Streudiagramm mit den wenigsten Schritten zu erstellen.

  2. Es erscheint das folgende Dialogfeld. Hier wählen wir die erste Option, Einfaches Streudiagramm, aus. Mit einem Klick auf Definieren bestätigen wir.

    Korrelation: Linearität bestimmen #1: Auswahl treffen


  3. In dem Dialog, der dann erscheint,…


  4. …tragen wir die beiden Variablen unserer Korrelation ein. Es ist egal, welche Variable auf die x- und welche auf die y-Achse kommt.


  5. Mit einem Klick auf OK erstellen wir unser Diagramm.

  6. In der Ausgabe finden wir das unterstehende Diagramm. Wir sehen einen linearen Trend in den Daten (wie im Beispiel oben).


Linearität mit SPSS überprüfen: Methode #2

  1. Bei der zweiten Möglichkeit probieren wir verschiedene Kurven aus und schauen, inwieweit sie auf unsere Daten passen. Dazu gehen wir zu Analysieren > Regression > Kurvenanpassung.


  2. Das folgende Dialogfenster erscheint.


  3. Hier können wir unsere Variablen eintragen. Jetzt ist es nicht mehr egal, welche Variable wir wo eintragen. Auf die unabhängige Variable wird die Transformation angewendet. Zuerst transformieren wir die Variable intervallskalierte Variableverhuet. Unter — Modelle — können wir die Transformationen auswählen. Hier können wir die auswählen, von denen wir glauben, dass sie Sinn machen werden. Wir wählen ausgewähltes KontrollkästchenLinearausgewähltes KontrollkästchenLogarithmischausgewähltes KontrollkästchenInversausgewähltes KontrollkästchenQuadratisch und ausgewähltes KontrollkästchenKubisch.

    Mit OK starten wir die Berechnung.

    SPSS stelle folgende Modelle zur Verfügung

    • Linear. Y = b0 + (b1 * t).
    • Logarithmisch. Y = b0 + (b1 * ln(t)).
    • Invers. Y = b0 + (b1 / t).
    • Quadratisch. Y = b0 + (b1 * t) + (b2 * t**2).
    • Kubisch. Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3).
    • Potenzfunktion. Y = b0 * (t**b1) oder ln(Y) = ln(b0) + (b1 * ln(t)).
    • Zusammengesetzt. Y = b0 * (b1**t) oder ln(Y) = ln(b0) + (ln(b1) * t).
    • S-Kurve. Y = e**(b0 + (b1/t)) oder ln(Y) = b0 + (b1/t).
    • Logistisch. Y = 1 / (1/u + (b0 * (b1**t))) oder ln(1/y-1/u) = ln(b0) + (ln(b1) * t).
    • Wachstumsfunktion. Y = e**(b0 + (b1 * t)) oder ln(Y) = b0 + (b1 * t).
    • Exponentiell. Y = b0 * (e**(b1 * t)) oder ln(Y) = ln(b0) + (b1 * t).


  4. In der Ausgabe berechnet SPSS die Modellzusammenfassung. Die erste Spalte ist R-Quadrat (r²). Je höher r² ist desto höher wird auch die Pearson Produkt-Moment-Korrelation (r) sein. Das Modell Linear (gelb markiert) ist das unveränderte Modell, wenn wir keine Transformationen anwenden.

    Zwar haben die Modelle Quadratisch und Kubisch (blau markiert) ein höheres r², es ist aber nur unwesentlich höher (.852 vs. .847 und .854 vs. .847). Dies liegt auch daran, dass das lineare Modell auch in den beiden anderen Modellen enthalten ist. Im nächsten Schritt versuchen wir es mit intervallskalierte Variablefruchtbar als Unabhängige Variable.


  5. Dazu vertauschen wir unabhängige und abhängige Variable und bestätigen wieder mit OK.


  6. Hier erhalten wir wieder eine Modellzusammenfassung. Das Modell verbessert sich wesentlich, wenn wir eine Transformation anwenden. Die größte Steigerung erfahren wir, wenn wir intervallskalierte Variablefruchtbar kubisch transformieren würden. Für unser Beispiel werden im nächsten Schritt intervallskalierte Variablefruchtbar kubisch transformieren, auch wenn die Steigerung im r² normalerweise nicht ausreichend wäre, um dies zu rechtfertigen.


  7. Um eine Variable zu transformieren, gehen wir wieder zu Analysieren > Regression > Kurvenanpassung


  8. Wir wollen die kubische Variable berechnen. Unter — Modelle — wählen wir daher nur ausgewähltes KontrollkästchenKubisch aus.

    Korrelation: Variable berechnen


  9. SPSS soll die Variable für uns berechnen und dann speichern. Dafür klicken wir auf Speichern…

  10. Unter — Variablen speichern — wählen wir hier ausgewähltes KontrollkästchenVorhergesagte Werte aus.

    Korrelation: Variable speichern


  11. Wir bestätigen die Auswahl mit einem Klick auf Weiter

  12. Mit einem Klick auf OK wird die neue Variable berechnet.

  13. SPSS fragt uns noch einmal, ob wir die Variable wirklich speichern wollen:

    Korrelation: Variable wirklich speichern?


  14. Wir bestätigen dies mit einem Klick auf OK

  15. SPSS hat nun eine neue Variable berechnet:

    Korrelation: neue Variable


Was tun wenn...

Wenn wir keine Linearität haben, auch nicht nach einer Transformation, gibt es zwei Möglichkeiten. Entweder wir können weiterhin die Pearson Produkt-Moment-Korrelation berechnen. Alternativ kann ein nicht-parametrisches Verfahren, wie beispielsweise die Korrelation von Spearman oder Kendall’s Tau, berechnet werden.