Binomiale Logistische Regression

Binomiale logistische Regression: Linearität interpretieren

Wie auf der vorherigen Seite besprochen, haben wir das Box–Tidwell Verfahren durchgeführt, um zu überprüfen, inwieweit Linearität unter unseren Variablen gegeben ist. SPSS generiert sehr viele Tabellen in unseren Ausgabe, von denen wir aber lediglich die zweite Tabelle mit der Überschrift Variablen in Gleichung benötigen. Sie enthält alle Informationen, die wir zur Bestimmung der Linearität benötigen.

Linearität interpretieren

Für unseren Beispieldatensatz sieht die Tabelle wie unten aus:

Variablen in der Gleichung
RegressionskoeffizientB Standardfehler Wald df Sig. Exp(B)
Schritt 1a Geschlecht des Teilnehmers(1) ,397 ,451 ,774 1 ,379 1,488
Alter des Teilnehmers ,341 ,664 ,264 1 ,607 1,407
Immunofaktor -1,661 1,042 2,540 1 ,111 ,190
Stunden Schlaf in der Vornacht -3,343 4,392 ,579 1 ,447 ,035
Zinkfaktor 1,944 1,168 2,769 1 ,096 6,988
Alter des Teilnehmers by alter_ln -,069 ,147 ,219 1 ,640 ,934
Immunofaktor by immunofaktor_ln ,360 ,230 2,441 1 ,118 1,433
Stunden Schlaf in der Vornacht by schlaf_ln ,796 1,374 ,336 1 ,562 2,217
Zinkfaktor by zink_ln -,381 ,208 3,355 1 ,067 ,683
Konstante 7,142 22,064 ,105 1 ,746 1263,692
a. In Schritt 1 eingegebene Variablen: Geschlecht des Teilnehmers, Alter des Teilnehmers, Immunofaktor, Stunden Schlaf in der Vornacht, Zinkfaktor, Alter des Teilnehmers * alter_ln , Immunofaktor * immunofaktor_ln , Stunden Schlaf in der Vornacht * schlaf_ln , Zinkfaktor * zink_ln .

Uns interessieren die p-Werte der Interaktionsterme (oben farbig hervorgehoben), da die Voraussetzung der Linearität nur auf kontinuierliche Variablen zutrifft. Ein signifikantes Ergebnis deutet hier darauf hin, dass keine Linearität gegeben ist. Wir legen hier als Alphaniveau \(\frac{0.05}{\text{Anzahl der Variablen im Modell (+Konstante)}} = \frac{0.05}{10} = \mathbf{0.005}\) zugrunde, was einer Bonferroni-Korrektur mit der Anzahl der Prädiktoren (plus der Konstante) im Modell entspricht (Tabachnick & Fidell, 2018, p. 377). Das errechnete Alphaniveau wird auch von dem Syntax-Generator auf der vorigen Seite mit berechnet.

In unserem Beispiel ist keine der Variablen auf einem Alphaniveau von .005 signifikant geworden – was auf mangelnde Linearität hingedeutet hätte. Entsprechend ist die Voraussetzung der Linearität für all unsere Variablen erfüllt. Dies könnten wir wie folgt berichten:

Deutsch
Linearität wurde mit dem Box-Tidwell-Verfahren überprüft (Box & Tidwell, 1962). Für alle zehn Terme im Modell wurde die Bonferroni-Korrektur angewendet (Tabachnick & Fidell, 2018). Basierend darauf, konnte Linearität für alle Variablen angenommen werden.
English
Linearity was tested assessed using the Box-Tidwell (Box & Tidwell, 1962) procedure. Bonferroni-correction was applied to all ten terms in the model (Tabachnick & Fidell, 2018). All variables were found to follow a linear relationship.
 

Linearität nicht gegeben? Was nun?!

Sollten auch nach Anwendung der Bonferroni-Korrektur noch eine oder mehrere Variablen signifikant – und damit nicht-linear – sind, gibt es mehrere Möglichkeiten, wie wir vorgehen könnten:

  1. Wir könnten eine Transformation durchführen. Hier gibt es mehrere Möglichkeiten und die geeignete Transformationen hängt letztlich von der Beschaffenheit der eigenen Daten ab. Es gibt auch allgemeinere Transformationen, wie beispielsweise Box-Cox-Transformation oder die Johnson-Transformation, die ebenfalls Anwendbarkeit finden könnten.
    Hier ist zu beachten, dass jeweils nur die ursprüngliche Variable transformiert wird. Nach erfolgter Transformation muss das Box-Tidwell-Verfahren mit den neu erstellten Variablen erneut durchgeführt werden.
     
  2. Da die Voraussetzung der Linearität nur auf kontinuierliche Variablen zutrifft, kann auch versucht werden, non-lineare Variablen auf ein dichotomes bzw. ordinales Skalenniveau zu reduzieren. Dies kann beispielsweise durch die Einteilung in Klassen erfolgen (wie Altersklassen), durch die Anwendung von Cut-Off-Werten (beispielsweise wenn Testverfahren mit einer Normstichprobe verwendte wurden) oder durch den Einsatz von Verfahren, die die Stichprobe unterteilen, beispielsweise mittels Median-Split.

Literaturverzeichnis

  1. Box, G. E. P., & Tidwell, P. W. (1962). Transformation of the Independent Variables. Technometrics, 4(4), 531–550. doi:10.1080/00401706.1962.10490038
  2. Tabachnick, B. G., & Fidell, L. S. (2018). Using Multivariate Statistics (7th ed.): Pearson Education.