Binomiale logistische Regression: Einstieg in die Interpretation und Auswertung
Die folgenden Seiten werden sich jetzt mit der Interpretation und Auswertung der Ergebnisse beschäftigen. SPSS hat uns eine ganze Reihe verschiedener Tabellen erzeugt, die wir für die Interpretation der weiteren Voraussetzungen und schlussendlich der Ergebnisse benötigen.
Die binomiale logistische Regression wird meistens durchgeführt, um eines von zwei verschiedenen Zielen zu erreichen. Zum einen können wir untersuchen, welche Variable einen statistisch signifikanten Einfluss auf die Modellgüte und damit die Klassifikationsgüte haben. Zum anderen können wir das Gesamtmodell betrachten und bestimmen, wie gut es in der Lage ist, die Beobachtungen in eine der beiden Gruppen zu klassifizieren.
Datenintegrität
Im ersten Schritt schauen wie uns noch einmal genau die Anzahl der eingeschlossenen (und ausgeschlossenen) Fälle an und stellen sicher, dass unsere Kodierung korrekt gewesen ist. Dazu gehört auch, dass wir sicher stellen, dass bei kategorialen Variablen keine Kategorien existieren, bei denen nur wenig Fälle vorhanden sind. Kategorien mit nur wenigen Fällen kann für die binomiale logistische Regression problematisch werden.
Baseline-Analyse
Im nächsten Schritt schauen wir die Baseline an. Bei der binomialen logistischen Regression ist die Baseline das erste Modell, bei dem noch keine unserer Prädiktoren aufgenommen wurden. Es wird bei SPSS auch Block 0: Anfangsblock genannt. Hier sehen wir, wie gut die Klassifikation wäre, wenn wir dem Modell keine weiteren Informationen zur Verfügung stellen. Eine gleiche Verteilung der Gruppen, also 50% in der einen Gruppe des Kriteriums und 50% in der anderen Gruppe, wären hier ideal.
Die Baseline-Analyse gibt uns einen Vergleich, gegen den wir unser Modell testen können.
Ergebnisse der binomialen logistischen Regression
Anschließen schauen wir uns das eigentliche Modell an und überprüfen seine Güte. Hier interessiert uns vor allem die statistische Signifikanz des Gesamtmodells. Allerdings überprüfen wir auch die Anpassung mit dem Hosmer-Lemeshow-Test, der den Goodness-of-Fit bestimmt. In diesem Teil betrachten wir auch die Varianzaufklärung, das R². Für die binomiale logistische Regression existiert kein einheitliches Maß der Varianzaufklärung: Hier haben wir die Wahl zwischen dem Cox & Snell R-Quadrat und Nagelkerkes R-Quadrat.
Klassifikation
Die Vorhersage der Kategorie, also die Klassifikation, die durch unser Modell stattfindet, ist eines der wichtigsten Punkte der logistischen Regression. Wir wollen wissen, inwieweit unsere Prädiktoren das Kriterium korrekt vorhersagen können. Eine Klassifikationsgüte von 50% wäre nicht besser als der Zufall, sodass wir dies als Richtmaß betrachten. Auch müssen wir hier unser Baseline-Modell betrachten, da eine Verbesserung der Klassifikation in Relation zu der Basisverteilung des Kriteriums gesehen werden muss.
Variablen interpretieren
Zu letzt betrachten wir die Variablen in der Regressionsgleichung und interpretieren sie. Hier betrachten wir nicht nur die reine Signifikanz, sondern auch das Odds-Ratio, das vor allem in medizinischen und psychologischen Studien von großer Relevanz ist. Dadurch können wir Aussagen wie: „Das Odds ist ist 5.12 mal größer für Erwachsene, als für Kinder zu erkranken“.
Legen wir los!