Spearman Korrelation

Spearman-Korrelation: Spearman vs. Pearson

Ein Korrelationskoeffizient misst den Grad, in dem zwei Variablen dazu neigen, sich gemeinsam zu verändern. Der Koeffizient beschreibt sowohl die Stärke als auch die Richtung der Beziehung.

Pearson-Produkt-Moment-Korrelation

Die Pearson-Korrelation beurteilt die lineare Beziehung zwischen zwei kontinuierlichen Variablen. Eine Beziehung ist linear, wenn eine Änderung in einer Variablen mit einer proportionalen Änderung in der anderen Variablen verbunden ist. Eine proportionale Beziehung wäre beispielsweise dann gegeben, wenn sich eine Variable immer verdoppeln würde, wenn es auch die andere täte.

So könnte man z. B. eine Pearson-Korrelation verwenden, um zu bewerten, ob die Nervenleitfähigkeit mit dem Vitamin B5 Konzentration im Blut in Beziehung steht.

Spearman-Korrelation

Die Spearman-Korrelation beurteilt die monotone Beziehung zwischen zwei kontinuierlichen oder ordinalen Variablen. Bei einer monotonen Beziehung neigen Variablen dazu, sich gemeinsam zu verändern, aber nicht unbedingt mit konstanter Änderungsrate. Eine monotone Beziehung wäre beispielsweise dann gegeben, wenn eine Variable ansteigen würde, würde dies auch die andere tun. Dabei ist der Grad des Anstiegs prinzipiell irrelevant: Wichtig ist, dass wenn eine Variable größer (oder kleiner) wird, dies auch der Fall für die andere Variable ist. Der Spearman-Korrelationskoeffizient basiert auf den Rangwerten jeder Variable und nicht auf den Rohdaten.

Die Spearman-Korrelation wird oft verwendet, um Beziehungen mit ordinalen Variablen auszuwerten. So könnte man z. B. eine Spearman-Korrelation verwenden, um zu untersuchen, ob die Reihenfolge, in der die Mitarbeiter eine Testaufgabe bearbeiten, mit der Anzahl der Monate zusammenhängt, die sie bereits beschäftigt sind.

Es ist immer eine gute Idee, die Beziehung zwischen Variablen mit einem Streudiagramm zu untersuchen. Korrelationskoeffizienten messen nur lineare (Pearson) oder monotone (Spearman) Beziehungen. Andere Arten von Beziehungen sind möglich und können eventuell durch Transformationen ebenfalls durch einen der beiden Koeffizienten abgebildet werden.

Spearman vs. Pearson

Spearman vs. Pearson #1Die Korrelationskoeffizienten von Pearson und Spearman können Werte zwischen -1 und +1 annehmen. Der Pearson-Korrelationskoeffizient beträgt +1, wenn bei einem Anstieg einer Variablen die andere Variable um den gleichen Faktor ansteigt. Diese Beziehung bildet eine perfekte Linie. Der Spearman-Korrelationskoeffizient ist in diesem Fall ebenfalls +1.

Spearman vs. Pearson #2Wenn die Beziehung so aussieht, dass eine Variable zunimmt, wenn die andere zunimmt, aber der Faktor nicht konsistent ist, ist die Beziehung zwischen beiden Variablen monoton. In diesem Fall ist der Pearson-Korrelationskoeffizient positiv, aber kleiner als +1. Der Spearman-Korrelationskoeffizient ist in diesem Fall immer noch gleich +1.

Spearman vs. Pearson #3Beide Koeffizienten geben auch die Richtung der Beziehung mittels des Vorzeichens an. Tritt der umgekehrte Fall zu dem ersten Beispiel ein, nämlich dass eine Variable ansteigt und der andere Variable um einen konstanten Faktor mit ihr fällt, ist die Beziehung negativ oder invers. Beide Koeffizienten hätten hier ein negatives Vorzeichen.

Spearman vs. Pearson #4Besteht gar keine Beziehung zwischen den Variablen, wie es beispielsweise bei zufälligen Daten der Fall ist, sind beide Korrelationskoeffizienten etwa Null. Ein Wert von Null oder nahe Null heißt aber nicht zwangsläufig, dass keine Beziehung zwischen den Variablen besteht, sondern nur dass keine lineare Beziehung (bei Pearson) bzw. keine monotone Beziehung (bei Spearman) festgestellt werden konnte.

Spearman vs. Pearson #5Dies kann man beispielsweise an dem Beispiel rechts sehen. Hier existiert ganz klar eine U-förmige Beziehung zwischen den Variablen – sie ist allerdings weder linear noch monoton. Deshalb sind beide Koeffizienten auch nahe Null. Wir empfehlen deshalb auch immer eine visuelle Inspektion der Variablen, z. B. mit einem Streudiagramm.