Binomiale logistische Regression: Variablen vorbereiten
Obwohl man oft davon ausgeht, dass die logistische Regression Linearität nicht direkt voraussetzt, gehen wir davon aus, dass die Beziehungen zwischen den kontinuierlichen Prädiktoren und dem Logit linear sind. Diese Annahme kann getestet werden, indem in das Modell die Interaktionen zwischen den kontinuierlichen Prädiktoren und ihrem logarithmierten Wert aufgenommen werden (Box & Tidwell, 1962). Wenn eine solche Interaktion signifikant ist, gehen wir davon aus, dass die Annahme verletzt wurde.
Box–Tidwell Verfahren
Der erste Schritt im Box–Tidwell Verfahren besteht dahin, alle kontinuierlichen Variablen (also Variablen, die mindestens intervallskaliert sind) mit dem natürlichen Logarithmus zu transformieren. Dies sind in unserem Beispiel die Variablen schlaf, alter, immunofaktor und zink.
Im zweiten Schritt bilden wir die Interaktionsterme zwischen jeder kontinuierlichen Variable und ihrem logarithmierten Pendant. Linearität ist dann gegeben, wenn die Interaktion jeweils nicht signifikant ist. Wir empfehlen hier auch die p-Werte mit der Bonferroni-Korrektur zu adjustieren, wie es auch Tabachnick und Fidell (2018) empfehlen.
Da SPSS das Box–Tidwell Verfahren nicht direkt ausführt, müssen wir alle Schritte manuell durchführen. Dies kann – vor allem bei größeren Modellen mit vielen Prädiktoren – zeitlich recht aufwendig sein. Um diese Arbeit zu vereinfachen, haben wir unten einen Syntax-Generator bereitgestellt, der nach Eingabe der Variablennamen entsprechend eine SPSS-Syntax ausgibt, die zuerst den Logarithmus der kontinuierlichen Variablen berechnet und anschließend eine logistische Regression mit den Interaktionstermen berechnet.
Für unseren Beispieldatensatz wäre diagnose das Kriterium (d.h. die abhängige Variable), geschlecht ein kategorialer Prädiktor und die Variablen alter, immunofaktor, schlaf und zink kontinuierliche Prädiktoren, die wir in die entsprechenden Felder eintragen. Für die p-Werte wird noch zusätzliche entsprechend das adjustiertes Alpha-Niveau berechnet und em Ende der Syntax angezeigt.
Box–Tidwell SPSS-Syntax erstellen
Abhängige Variable
Kategoriale Prädiktoren
Kontinuierliche Prädiktoren
SPSS Syntax
_ln
erstellt (d.h. für eine Variable alter
würde eine neue Variable alter_ln
erstellt werden). Es sollte daher sichergestellt werden, das keine Variablen, die dieser Struktur entsprechen, bereits im Datensatz vorhanden sind, da sie sonst beim Ausführen der Syntax überschrieben werden.Für unseren Beispieldatensatz hätten wir entsprechend folgende Syntax generiert:
* Logarithmus der kontinuierlichen Variablen berechnen und als neue Variable speichern COMPUTE alter_ln=LN(alter). COMPUTE immunofaktor_ln=LN(immunofaktor). COMPUTE schlaf_ln=LN(schlaf). COMPUTE zink_ln=LN(zink). EXECUTE. * Logistische Regression mit Interaktionstermen berechnen LOGISTIC REGRESSION VARIABLES diagnose /METHOD=ENTER geschlecht alter immunofaktor schlaf zink alter*alter_ln immunofaktor*immunofaktor_ln schlaf*schlaf_ln zink*zink_ln /CONTRAST (geschlecht)=Indicator(1) /CRITERIA=PIN(.05) POUT(.10) ITERATE(20) CUT(.5). * Bei 5 Prädiktoren (plus der Konstante) wäre bei Variablen * mit einem p < 0.00500 keine Linearität gegeben.
Um die Ausgabe zu erhalten, müssen wir die Syntax als nächstes ausführen.
SPSS Syntax ausführen
- Als erstes erstellen wir eine neue Syntaxdatei. Hierfür gehen wir zu Datei > Neu > Syntax.
- In dieses Fenster fügen wir unsere Syntax ein.
- Als letztes müssen wir noch den Syntax ausführen. Hierfür gehen wir im Syntaxfenster auf Ausführen > Alle.
Auf der nächsten Seite besprechen wir die Interpretation und Verschriftlichung der Linearität.
Literaturverzeichnis
- Box, G. E. P., & Tidwell, P. W. (1962). Transformation of the Independent Variables. Technometrics, 4(4), 531–550. doi:10.
1080/ 00401706. 1962. 10490038 - Tabachnick, B. G., & Fidell, L. S. (2018). Using Multivariate Statistics (7th ed.): Pearson Education.