Binomiale Logistische Regression

Binomiale Logistische Regression: Modellgüte

Als nächstes betrachten wir die Modellgüte. Hierfür schauen wir uns zuerst die Signifikanz des Modells und dann die Varianzaufklärung an.

In der Tabelle Omnibus-Tests der Modellkoeffizienten finden wir Signifikanzangaben für unser Modell. Hier finden sich drei Angaben, die für unseren Aufbau des Modells alle gleich sind. Das Dialogfenster der binomialen logistischen Regression erlaubt uns – ähnlich wie das Dialogfenster der multiple linearen Regression – verschiedene Blöcke einzugeben und dadurch eine hierarchische binomiale logistische Regression durchzuführen. Dies ist für unsere Fragestellung allerdings nicht relevant, so dass wir nur einen Block (hierarchische Ebene) und einen Schritt haben. Entsprechend sind alle Werte der Tabelle gleich. Wir interessieren uns für die Signifikanz des Gesamtmodells und würden daher die Zeile Modell in der Tabelle interpretieren.

Omnibus-Tests der Modellkoeffizienten
Chi-Quadrat df Sig.
Schritt 1 Schritt 602,342 5 ,000
Block 602,342 5 ,000
Modell 602,342 5 ,000

Unser Modell leistet eine signifikante prädiktive Leistung. Dies könnten wir so berichten:

Deutsch
Das binomial logistische Regressionsmodell war statistisch signifikant, χ²(5) = 602.34, p < .001.
English
The binomial logistic regresison model was statistically significant, χ²(5) = 602.34, p < .001.
Auch wenn SPSS in der Spalte Signifikanz einen Wert von .000 angibt, ist dies nur ein gerundeter Wert (Signifikanzen können weder den Wert 0 noch 1 annehmen, sondern liegen immer dazwischen.) Bei einem Wert von .000 würden wir dies als p < .001 schreiben. Das APA-Handbuch empfiehlt ansonsten die Angabe genauer p-Werte (gerundet auf drei Nachkommastellen).

Hosmer-Lemeshow-Test

Wir können auch den umgekehrten Weg gehen und überprüfen, wie gut die Anpassungsgüte unseres Modells ist. Dies macht der Hosmer-Lemeshow-Test. Hier würde ein signifikantes Ergebnis für eine schlechte Anpassungsgüte sprechen. Wir wollen also beim Hosmer-Lemeshow-Test ein nicht-signifkantes Ergebnis erzielen, was wir in unserem Beispieldatensatz auch haben.

Hosmer-Lemeshow-Test
Schritt Chi-Quadrat df Sig.
1 11,366 8 ,182

Dies könnten wir so berichten:

Deutsch
Anpassungsgüte wurde mit dem Hosmer-Lemeshow-Test überprüft, der eine hohe Anpassungsgüte zeigte, χ²(8) = 11.37, p > .05.
English
Goodness-of-fit was assessed using the Hosmer-Lemeshow-Test, indicating a good model fit, χ²(8) = 11.37, p > .05.
 

Hosmer-Lemeshow-Test signifikant, was nun?!

Der Hosmer-Lemeshow-Test ist ein Test der relativ sensitiv ist, vor allem bei größeren Stichproben (Guo & Fraser, 2015, p. 139) — auch wenn es dazu auch gegenteilige Meinungen gibt (Petrie & Sabin, 2009). Würden wir beispielsweise die Diagnose unseres letzten Falls (VP-Nummer 569) auf gesund ändern, hätten wir einen hoch-signifkanten Hosmer-Lemeshow-Test, bei insgesamt fast 600 Fällen. Rossi (2010, p. 458) empfiehlt daher den Hosmer-Lemeshow-Test nur einzusetzen, wenn \(p < \frac{n}{10}\), wobei p die Anzahl der Prädiktoren und n die Anzahl der Beobachtungen sind.

Aus diesem Grund eignet sich dieser Test nicht immer für zur Bestimmung der Anpassungsgüte. Wir empfehlen daher das Ergebnis dieses Tests nicht starr zu interpretieren: Auch wenn die Anpassungsgüte gemäß dem Hosmer-Lemeshow-Test nicht gegeben ist, kann die binomial logistische Regression gute und valide Ergebnisse liefern.

Literaturverzeichnis

  1. Guo, S., & Fraser, M. W. (2015). Propensity score analysis: Statistical methods and applications (Second edition). Advanced quantitative techniques in the social sciences: Vol. 11. Los Angeles: SAGE.
  2. Petrie, A., & Sabin, C. (2009). Medical statistics at a glance (3rd ed.). At a glance series. Chichester: Wiley-Blackwell.
  3. Rossi, R. J. (2010). Applied biostatistics for the health sciences. Oxford: Wiley.