Binomiale Logistische Regression: Varianzaufklärung
Neben der Modellgüte ist die Varianzaufklärung einer der wichtigsten Ergebnisse der Regressionsanalyse. Die Varianzaufklärung der binomial logistischen Regression ist allerdings nicht identisch mit dem bekannten R² der linearen Regressionsanalyse, wurde aber so konzipiert, dass die Interpretation analog erfolgen kann, allerdings mit anderen Faustregeln der Effektgröße.
Generell stellt uns SPSS zwei verschiedene Maße der Varianzaufklärung zur Verfügung: das Cox & Snell R-Quadrat und Nagelkerkes R-Quadrat. Das erste, was einem ins Auge fällt ist, dass Nagelkerkes R² größer ist als das Cox & Snell R². Dies ist tatsächlich immer der Fall.
Die Varianzaufklärung von Cox & Snell hat einen Fehler in der Berechnung, der dafür sorgt, dass das Maximum der Varianzaufklärung den Wert 1 nie erreichen kann. Natürlich ist es allerdings so, dass die Varianzaufklärung eines Modells sehr wohl 100% betragen könnte, weshalb Nagelkerkes die ursprüngliche Formel von Cox & Snell modifiziert hat, um diesen Mangel zu beheben. (In manchen Quellen wird das Nagelkerkes R² auch Cragg & Uhlers R² genannt.)
Varianzaufklärung bestimmen und berichten
Beide Maße werden in der Tabelle Modellzusammenfassung in der Ausgabe von SPSS berichtet. Hier interessiert uns die Spalte ganz rechts mit Nagelkerkes R-Quadrat.
Modellzusammenfassung | |||
---|---|---|---|
Schritt | -2 Log-Likelihood | Cox & Snell R-Quadrat | Nagelkerkes R-Quadrat |
1 | 148,048a | ,653 | ,891 |
a. Schätzung beendet bei Iteration Nummer 9, weil die Parameterschätzer sich um weniger als ,001 änderten. |
Interpretation
Für die meisten Maße der Effektstärke existieren von Cohen Richtlinen zur Interpretation – nicht aber für Nagelkerkes R². Hier können wir aber die Empfehlungen von Backhaus (2003) zu Rate ziehen, die wir unten noch einmal zusammengefasst haben:
Interpretation von Nagelkerkes R², abgewandelt nach Backhaus et al. (2006, p. 456) | |
---|---|
akzeptabel (kleiner Effekt) | R² > .2 |
gut (mittlerer Effekt) | R² > .4 |
sehr gut (großer Effekt) | R² > .5 |
Gemäß Backhaus (2006) haben wir mit einem Nagelkerkes R² einen großen Effekt, den wir so berichten könnten:
Das binomial logistische Regressionsmodell war statistisch signifikant, χ²(5) = 602.34, p < .001, mit einer sehr guten Varianzaufklärung von Nagelkerkes R² = .891, gemäß den Empfehlungen von Backhaus et al. (2006).
English
The binomial logistic regresison model was statistically significant, χ²(5) = 602.34, p < .001, resulting in a large amount of explained variance (Backhaus et al., 2006), as shown by Nagelkerke’s R² = .891.
Literaturverzeichnis
- Backhaus, K., Erichson, B., Plinke, W., & Weiber, R. (2006). Multivariate Analysemethoden: Eine anwendungsorientierte Einführung (11th ed.). Berlin: Springer.
- Nagelkerke, N. J. D. (1991). A note on a general definition of the coefficient of determination. Biometrika, 78(3), 691–692. doi:10.
1093/ BIOMET/ 78. 3. 691