Einführung in die binomiale logistische Regression mit SPSS
Binomiale (oder binäre) logistische Regression ist eine Form der multiplen Regression, die angewendet wird, wenn die abhängige Variable dichotom ist – d. h. nur zwei verschiedene mögliche Werte hat. Wie andere Regressionsarten erzeugt logistische Regression B-Gewichte (oder Koeffizienten) und eine Konstante. Im Gegensatz zur multiplen Regression werden diese Koeffizienten allerdings dazu verwendet, um etwas zu berechnen, das als Logit bezeichnet wird. Der Logit ist der natürliche Logarithmus der Odds und damit der Chance für das Eintreten eines Ereignisses.
Logistische Regression ist ebenfalls konzeptionell verwandt mit dem ungepaarten t-Test, auch wenn beide Modelle mathematisch nicht viel gemeinsam haben. Man könnte sagen, binomiale macht das, was der t-Test macht – nur umgekehrt. Beim t-Test geben wir zwei Gruppen und eine abhängige Variable vor. Wir wollen wissen, ob sich beide Gruppen in ihren Mittelwerten unterscheiden. Bei der binomiale logistische Regression sind die Gruppen unsere abhängige Variable und wir wollen schauen, wie gut wir mit unserer abhängigen Variable (oder mehreren Variablen) die Gruppenzugehörigkeit vorhersagen können (Klassifikation).
Damit ist binomiale logistische Regression für Fälle geeignet, bei denen unsere Daten ein binäres Outcome haben. Dies ist beispielsweise bei epidemiologischen Daten der Fall, wenn wir die Faktoren untersuchen wollen, die zu einer Erkrankung führen. Unser Outcome ist hier, ob eine Person erkrankt ist oder nicht. Bei anderen Studien könnte uns interessieren, ob ein Schüler eine Prüfung bestanden hat oder nicht, ob eine arbeitssuchende Person eine Beschäftigung bekommen hat, oder ob eine Email als Spam ist oder nicht.
Themenüberblick
Im ersten Teil werden wir einen Überblick über alle Voraussetzungen der binomiale logistische Regression geben und zeigen, wie man sie mit SPSS überprüft. In dem Abschnitt Daten zeigen wir wie die Daten aufbereiten sein müssen, damit wir damit eine binomiale logistische Regression berechnen können. Hier findet sich auch zusätzlich ein Beispieldatensatz, den wir für alle Berechnungen verwenden werden.
Sobald wir die Daten bereit haben, überprüfen wir, ob alle Voraussetzungen der binomiale logistische Regression erfüllt sind. Bei Verletzungen einzelner Voraussetzungen existieren auch teilweise Korrekturen und Maßnahmen, die wir ebenfalls dort besprechen. Danach kann die eigentliche Datenanalyse beginnen. Jeden einzelnen Schritt zur Durchführung der binomiale logistische Regression besprechen wir danach.
Zu guter Letzt müssen die Ergebnisse unserer Datenauswertung noch interpretiert und verschriftlicht werden. Dies tun wir im letzten Teil. Entsprechende Musterformulierungen in deutscher und englischer Sprache stehen auch zur Verfügung. Zusätzlich gehen wir auch noch auf die entsprechenden Effektstärken ein.