Binomiale Logistische Regression

Binomiale Logistische Regression: Varianzaufklärung

Neben der Modellgüte ist die Varianzaufklärung einer der wichtigsten Ergebnisse der Regressionsanalyse. Die Varianzaufklärung der binomial logistischen Regression ist allerdings nicht identisch mit dem bekannten R² der linearen Regressionsanalyse, wurde aber so konzipiert, dass die Interpretation analog erfolgen kann, allerdings mit anderen Faustregeln der Effektgröße.

Generell stellt uns SPSS zwei verschiedene Maße der Varianzaufklärung zur Verfügung: das Cox & Snell R-Quadrat und Nagelkerkes R-Quadrat. Das erste, was einem ins Auge fällt ist, dass Nagelkerkes R² größer ist als das Cox & Snell R². Dies ist tatsächlich immer der Fall.

Die Varianzaufklärung von Cox & Snell hat einen Fehler in der Berechnung, der dafür sorgt, dass das Maximum der Varianzaufklärung den Wert 1 nie erreichen kann. Natürlich ist es allerdings so, dass die Varianzaufklärung eines Modells sehr wohl 100% betragen könnte, weshalb Nagelkerkes die ursprüngliche Formel von Cox & Snell modifiziert hat, um diesen Mangel zu beheben. (In manchen Quellen wird das Nagelkerkes R² auch Cragg & Uhlers R² genannt.)

Varianzaufklärung bestimmen und berichten

Beide Maße werden in der Tabelle Modellzusammenfassung in der Ausgabe von SPSS berichtet. Hier interessiert uns die Spalte ganz rechts mit Nagelkerkes R-Quadrat.

Modellzusammenfassung
Schritt -2 Log-Likelihood Cox & Snell R-Quadrat Nagelkerkes R-Quadrat
1 148,048a ,653 ,891
a. Schätzung beendet bei Iteration Nummer 9, weil die Parameterschätzer sich um weniger als ,001 änderten.

Interpretation

Für die meisten Maße der Effektstärke existieren von Cohen Richtlinen zur Interpretation – nicht aber für Nagelkerkes R². Hier können wir aber die Empfehlungen von Backhaus (2003) zu Rate ziehen, die wir unten noch einmal zusammengefasst haben:

Interpretation von Nagelkerkes R², abgewandelt nach Backhaus et al. (2006, p. 456)
akzeptabel (kleiner Effekt) R² > .2
gut (mittlerer Effekt) R² > .4
sehr gut (großer Effekt) R² > .5

Gemäß Backhaus (2006) haben wir mit einem Nagelkerkes R² einen großen Effekt, den wir so berichten könnten:

Deutsch
Das binomial logistische Regressionsmodell war statistisch signifikant, χ²(5) = 602.34, p < .001, mit einer sehr guten Varianzaufklärung von Nagelkerkes R² = .891, gemäß den Empfehlungen von Backhaus et al. (2006).
English
The binomial logistic regresison model was statistically significant, χ²(5) = 602.34, p < .001, resulting in a large amount of explained variance (Backhaus et al., 2006), as shown by Nagelkerke’s R² = .891.

Literaturverzeichnis

  1. Backhaus, K., Erichson, B., Plinke, W., & Weiber, R. (2006). Multivariate Analysemethoden: Eine anwendungsorientierte Einführung (11th ed.). Berlin: Springer.
  2. Nagelkerke, N. J. D. (1991). A note on a general definition of the coefficient of determination. Biometrika, 78(3), 691–692. doi:10.1093/BIOMET/78.3.691