Multiple Lineare Regression: Beispieldatensatz
Für alle Berechnungen dient als Beispiel der folgende Datensatz. Mit ihm können dieselben Berechnungen durchgeführt werden, sowie die Ergebnisse mit denen der Berechnungen in diesem Tutorial verglichen werden. Natürlich ist ein Rechnen mit den eigenen Daten möglich, aber für unerfahrene Benutzer empfiehlt es sich, erst einmal Erfahrung zu Sammeln. Die Berechnungen mit unserem Beispieldatensatz können direkt mit den Ergebnissen überprüft werden.
Was wir machen werden
Der Beispieldatensatz besteht aus vier Variablen, die jeweils für 100 Person erhoben wurden. Die Daten stammen von Verbeek (2004).
Das komplette SPSS-Beispieldatenfile kann hier heruntergeladen werden.
Wir wollen untersuchen, inwieweit sich das Gehalt pro Stunde (Kriterium) durch die Prädiktoren Geschlecht, Ausbildung (in Jahren) und Erfahrung (in Jahren) vorhersagen lässt. Wir wollen wissen, wie gut diese drei Prädiktoren das Einkommen voraussagen können, welche Prädiktoren die besten dafür sind und wie gut unser Modell allgemein ist.
In unserem Datensatz ist die Variable Geschlecht dichotom kodiert. Das heißt: Frauen haben den Wert 0 und Männer den Wert 1. Damit sind Frauen die Referenzkategorie. Diese Art, Variablen zu kodieren, heißt Dummykodierung. Dies wird noch für die Interpretation der Daten wichtig sein, da Ergebnisse in Relation zur Referenzkategorie interpretiert werden. Ansonsten macht es allerdings keinen Unterschied, ob wir Männern oder Frauen die Werte Eins oder Null zuweisen. Dummykodierung ist wichtig für alle nomialen Variablen.
Der Beispieldatensatz mit den vier Variablen wird in SPSS so aussehen:
Auf der nächsten Seite werden wir zuerst die lineare Regression in SPSS durchführen und im Anschluss die Voraussetzungen überprüfen. SPSS berechnet die meisten Statistiken, die wir benötigen werden, automatisch für uns.
Literaturverzeichnis
- Verbeek, M. (2004). A guide to modern econometrics. Hoboken, NJ: Wiley.