Binomiale Logistische Regression

Binomiale Logistische Regression: Baseline-Analyse

Im ersten Teil der eigentlichen Auswertung schauen wir uns das Baseline-Modell an. Bei der binomialen logistischen Regression ist das Baseline-Modell das erste Modell, bei dem noch keine unserer Prädiktoren aufgenommen wurden. Es wird bei SPSS auch Block 0: Anfangsblock genannt. Hier sehen wir, wie gut die Klassifikation wäre, wenn wir unserem Modell keine weiteren Informationen zur Verfügung stellen würden.

Block 0

Unter der Überschrift Block 0: Anfangsblock finden wir die Klassifizierungstabelle. Sie gibt uns noch einmal Aufschluss über die Verteilung der beiden Antwortmöglichkeiten unseres binären Kriteriums. In unserem Beispieldatensatz haben wir insgesamt 211 symptomfreie und 358 erkrankte Patienten. Dies entspricht 62,9% erkrankten Patienten, wie uns die Zeile Gesamtprozentsatz in der Tabelle sagt.

Wenn wir also schlicht jeden Fall als „erkrankt“ klassifizieren würden, hätten wir bereits 62,9% der Fälle korrekt klassifiziert. Dies ist 12,9% besser als der Zufall.

Klassifizierungstabellea,b
Beobachtet Vorhergesagt
Diagnose Prozentsatz der Richtigen
symptomfrei erkrankt
Schritt 0 Diagnose symptomfrei 0 211 ,0
erkrankt 0 358 100,0
Gesamtprozentsatz 62,9
a. Konstante in das Modell einbezogen.
b. Der Trennwert lautet ,500

Dieses Modell wird im späteren Teil der Interpretation noch interessant, wenn wir uns Maße der Effektstärke bzw. der Varianzaufklärung anschauen. Die beiden Maße, das Cox & Snell R-Quadrat und Nagelkerkes R-Quadrat, basieren darauf zu schauen, inwieweit das Modell mit unseren Prädiktoren eine bessere Vorhersageleistung trifft, als dieses Null-Modell.

Sollte hier ein starkes Ungleichgewicht herrschen und die meisten Fälle bereits ohne zusätzliche Informationen korrekt klassifiziert werden, ist die schlecht für die Modellbildung, da dann sogar das beste Modell kaum zusätzliche Information liefern kann.