Binomiale Logistische Regression

Binomiale logistische Regression: Linearität interpretieren

Wie auf der vorherigen Seite besprochen, haben wir das Box–Tidwell Verfahren durchgeführt, um zu überprüfen, inwieweit Linearität unter unseren Variablen gegeben ist. SPSS generiert sehr viele Tabellen in unseren Ausgabe, von denen wir aber lediglich die zweite Tabelle mit der Überschrift Variablen in Gleichung benötigen. Sie enthält alle Informationen, die wir zur Bestimmung der Linearität benötigen.

Linearität interpretieren

Für unseren Beispieldatensatz sieht die Tabelle wie unten aus:

Variablen in der Gleichung
RegressionskoeffizientB Standardfehler Wald df Sig. Exp(B)
Schritt 1a Geschlecht des Teilnehmers(1) ,387 ,436 ,788 1 ,375 1,472
Alter des Teilnehmers ,595 ,597 ,994 1 ,319 1,814
Immunofaktor 4,022 5,554 ,524 1 ,469 55,790
Stunden Schlaf in der Vornacht -15,313 13,943 1,206 1 ,272 ,000
Zinkfaktor 2,352 ,909 6,694 1 ,010 10,511
Alter des Teilnehmers by alter_ln -,124 ,132 ,881 1 ,348 ,884
Immunofaktor by immunofaktor_ln -,821 1,206 ,464 1 ,496 ,440
Stunden Schlaf in der Vornacht by schlaf_ln 4,039 4,042 ,998 1 ,318 56,760
Zinkfaktor by zink_ln -,452 ,163 7,670 1 ,006 ,636
Konstante -8,274 19,017 ,189 1 ,663 ,000
a. In Schritt 1 eingegebene Variablen: Geschlecht des Teilnehmers, Alter des Teilnehmers, Immunofaktor, Stunden Schlaf in der Vornacht, Zinkfaktor, Alter des Teilnehmers * alter_ln , Immunofaktor * immunofaktor_ln , Stunden Schlaf in der Vornacht * schlaf_ln , Zinkfaktor * zink_ln .

Uns interessieren die p-Werte der Interaktionsterme (oben farbig hervorgehoben), da die Voraussetzung der Linearität nur auf kontinuierliche Variablen zutrifft. Ein signifikantes Ergebnis deutet hier darauf hin, dass keine Linearität gegeben ist. Wir legen hier als Alphaniveau \(\frac{0.05}{\text{Anzahl der Variablen im Modell (+Konstante)}} = \frac{0.05}{10} = \mathbf{0.005}\) zugrunde, was einer Bonferroni-Korrektur mit der Anzahl der Prädiktoren (plus der Konstante) im Modell entspricht (Tabachnick & Fidell, 2018, p. 377). Das errechnete Alphaniveau wird auch von dem Syntax-Generator auf der vorigen Seite mit berechnet.

In unserem Beispiel ist zwar zink signifikant geworden – was auf mangelnde Linearität hingedeutet hätte – allerdings konnte diese Signifikanz nicht dem angepasstem Alphaniveau entsprechen. Entsprechend ist die Voraussetzung der Linearität für all unsere Variablen erfüllt. Dies könnten wir wie folgt berichten:

Deutsch
Linearität wurde mit dem Box-Tidwell-Verfahren überprüft (Box & Tidwell, 1962). Für alle zehn Terme im Modell wurde die Bonferroni-Korrektur angewendet (Tabachnick & Fidell, 2018). Basierend darauf, konnte Linearität für alle Variablen angenommen werden.
English
Linearity was tested assessed using the Box-Tidwell (Box & Tidwell, 1962) procedure. Bonferroni-correction was applied to all ten terms in the model (Tabachnick & Fidell, 2018). All variables were found to follow a linear relationship.
 

Linearität nicht gegeben? Was nun?!

Sollten auch nach Anwendung der Bonferroni-Korrektur noch eine oder mehrere Variablen signifikant – und damit nicht-linear – sind, gibt es mehrere Möglichkeiten, wie wir vorgehen könnten:

  1. Wir könnten eine Transformation durchführen. Hier gibt es mehrere Möglichkeiten und die geeignete Transformationen hängt letztlich von der Beschaffenheit der eigenen Daten ab. Es gibt auch allgemeinere Transformationen, wie beispielsweise Box-Cox-Transformation oder die Johnson-Transformation, die ebenfalls Anwendbarkeit finden könnten.
    Hier ist zu beachten, dass jeweils nur die ursprüngliche Variable transformiert wird. Nach erfolgter Transformation muss das Box-Tidwell-Verfahren mit den neu erstellten Variablen erneut durchgeführt werden.
     
  2. Da die Voraussetzung der Linearität nur auf kontinuierliche Variablen zutrifft, kann auch versucht werden, non-lineare Variablen auf ein dichotomes bzw. ordinales Skalenniveau zu reduzieren. Dies kann beispielsweise durch die Einteilung in Klassen erfolgen (wie Altersklassen), durch die Anwendung von Cut-Off-Werten (beispielsweise wenn Testverfahren mit einer Normstichprobe verwendte wurden) oder durch den Einsatz von Verfahren, die die Stichprobe unterteilen, beispielsweise mittels Median-Split.

Literaturverzeichnis

  1. Box, G. E. P., & Tidwell, P. W. (1962). Transformation of the Independent Variables. Technometrics, 4(4), 531–550. doi:10.1080/00401706.1962.10490038
  2. Tabachnick, B. G., & Fidell, L. S. (2018). Using Multivariate Statistics (7th ed.): Pearson Education.