Binomiale Logistische Regression

Binomiale logistische Regression: Variablen vorbereiten

Obwohl man oft davon ausgeht, dass die logistische Regression Linearität nicht direkt voraussetzt, gehen wir davon aus, dass die Beziehungen zwischen den kontinuierlichen Prädiktoren und dem Logit linear sind. Diese Annahme kann getestet werden, indem in das Modell die Interaktionen zwischen den kontinuierlichen Prädiktoren und ihrem logarithmierten Wert aufgenommen werden (Box & Tidwell, 1962). Wenn eine solche Interaktion signifikant ist, gehen wir davon aus, dass die Annahme verletzt wurde.

Wie bei allen statistischen Tests spielt auch hier die Power eine große Rolle. Statistische Power wird maßgeblich von der Stichprobengröße beeinflusst, wobei eine größere Stichprobe generell mehr Power hat. Sollte eine Interaktion signifikant werden, kann dies auch an einer hohen Power bzw. großen Stichprobe liegen. Bei großen Stichproben ist diese Voraussetzung daher meist nebensächlich.

Box–Tidwell Verfahren

Der erste Schritt im Box–Tidwell Verfahren besteht dahin, alle kontinuierlichen Variablen (also Variablen, die mindestens intervallskaliert sind) mit dem natürlichen Logarithmus zu transformieren. Dies sind in unserem Beispiel die Variablen schlaf, alter, immunofaktor und zink.

Im zweiten Schritt bilden wir die Interaktionsterme zwischen jeder kontinuierlichen Variable und ihrem logarithmierten Pendant. Linearität ist dann gegeben, wenn die Interaktion jeweils nicht signifikant ist. Wir empfehlen hier auch die p-Werte mit der Bonferroni-Korrektur zu adjustieren, wie es auch Tabachnick und Fidell (2018) empfehlen.

Da SPSS das Box–Tidwell Verfahren nicht direkt ausführt, müssen wir alle Schritte manuell durchführen. Dies kann – vor allem bei größeren Modellen mit vielen Prädiktoren – zeitlich recht aufwendig sein. Um diese Arbeit zu vereinfachen, haben wir unten einen Syntax-Generator bereitgestellt, der nach Eingabe der Variablennamen entsprechend eine SPSS-Syntax ausgibt, die zuerst den Logarithmus der kontinuierlichen Variablen berechnet und anschließend eine logistische Regression mit den Interaktionstermen berechnet.

Für unseren Beispieldatensatz wäre diagnose das Kriterium (d.h. die abhängige Variable), geschlecht ein kategorialer Prädiktor und die Variablen alter, immunofaktor, schlaf und zink kontinuierliche Prädiktoren, die wir in die entsprechenden Felder eintragen. Für die p-Werte wird noch zusätzliche entsprechend das adjustiertes Alpha-Niveau berechnet und em Ende der Syntax angezeigt.

Box–Tidwell SPSS-Syntax erstellen

Kategoriale Prädiktoren
Kontinuierliche Prädiktoren
SPSS Syntax

Es wird eine Syntax erstellt, die für jede kontinuierliche Variable eine neue, logarithmierte Variable mit gleichem Namen, aber dem Suffix _ln erstellt (d.h. für eine Variable alter würde eine neue Variable alter_ln erstellt werden). Es sollte daher sichergestellt werden, das keine Variablen, die dieser Struktur entsprechen, bereits im Datensatz vorhanden sind, da sie sonst beim Ausführen der Syntax überschrieben werden.

Für unseren Beispieldatensatz hätten wir entsprechend folgende Syntax generiert:

* Logarithmus der kontinuierlichen Variablen berechnen und als neue Variable speichern

COMPUTE alter_ln=LN(alter).
COMPUTE immunofaktor_ln=LN(immunofaktor).
COMPUTE schlaf_ln=LN(schlaf).
COMPUTE zink_ln=LN(zink).
EXECUTE.

* Logistische Regression mit Interaktionstermen berechnen

LOGISTIC REGRESSION VARIABLES diagnose
  /METHOD=ENTER geschlecht alter immunofaktor schlaf zink alter*alter_ln
    immunofaktor*immunofaktor_ln schlaf*schlaf_ln zink*zink_ln
  /CONTRAST (geschlecht)=Indicator(1)
  /CRITERIA=PIN(.05) POUT(.10) ITERATE(20) CUT(.5).

* Bei 5 Prädiktoren (plus der Konstante) wäre bei Variablen
* mit einem p < 0.00500 keine Linearität gegeben.

Um die Ausgabe zu erhalten, müssen wir die Syntax als nächstes ausführen.

SPSS Syntax ausführen


  1. Als erstes erstellen wir eine neue Syntaxdatei. Hierfür gehen wir zu Datei > Neu > Syntax.

    Binomiale Logistische Regression: Neue Syntaxdatei erstellen



  2. In dieses Fenster fügen wir unsere Syntax ein.

    Binomiale Logistische Regression: Syntax einfügen



  3. Als letztes müssen wir noch den Syntax ausführen. Hierfür gehen wir im Syntaxfenster auf Ausführen > Alle.

    Binomiale Logistische Regression: Syntax ausführen



Auf der nächsten Seite besprechen wir die Interpretation und Verschriftlichung der Linearität.

Literaturverzeichnis

  1. Box, G. E. P., & Tidwell, P. W. (1962). Transformation of the Independent Variables. Technometrics, 4(4), 531–550. doi:10.1080/00401706.1962.10490038
  2. Tabachnick, B. G., & Fidell, L. S. (2018). Using Multivariate Statistics (7th ed.): Pearson Education.