Hauptkomponentenanalyse

Hauptkomponentenanalyse: Interpretation der Voraussetzungen

Die Ausgabe der Hauptkomponentenanalyse enthält viele recht große Tabellen und wird damit schnell unübersichtlich. Oft müssen wir die Analyse auch noch ein zweites oder drittes Mal durchführen, bevor wir zu einem Ergebnis kommen.

Korrelationsmatrix

Die Korrelationsmatrix kann, je nachdem wie viele Variablen wir analysiert haben, mehrere Seiten lang werden. Für unsere 20 Variablen produziert SPSS eine 20×20 Matrix.

Hauptkomponentenanalyse: Korrelationsmatrix

Hier schauen wir nach, ob es Variablen gibt, die mit keiner anderen Variablen eine Korrelation von mindestens .3 haben. Solche Variablen sollten eventuell von der weiteren Analyse ausgeschlossen werden, da sie wenig zum Verständnis der Struktur der Daten beitragen. Im nächsten Schritt sollten wir Variablen suchen, die eine Korrelation von .9 oder höher haben. Hier besteht das Problem der Mulktikolinearität. Auch hier sollten wir eine der stark korrelierenden Variablen eventuell entfernen.

In unserem Beispieldatensatz sind alle Variablen in einem guten Bereich und keine Variable muss entfernt werden.

Auf der Diagonalen haben alle Variablen eine Korrelation von 1,000!

Kaiser-Meyer-Olkin-Kriterium

Das Kaiser-Meyer-Olkin-Kriterium (KMO-Kriterium) sagt uns, ob wir überhaupt mit einer Hauptkomponentenanalyse fortfahren sollten. Das KMO-Kriterium wird aus den partiellen Korrelationen zwischen Itempaaren berechnet.

Einige Autoren empfehlen hier ein Minimum von .5 (Cleff, 2015; Hartas, 2010; Field, 2013), andere einen Wert von .6 (Möhring & Schlütz, 2013; Tabachnick & Fidell, 2013). Unser Datensatz liegt mit .867 deutlich darüber.

KMO- und Bartlett-Test

Maß der Stichprobeneignung nach Kaiser-Meyer-Olkin. ,867
Bartlett-Test auf Sphärizität Ungefähres Chi-Quadrat 3275,489
df 190
Signifikanz nach Bartlett ,000
 

KMO-Kriterium zu klein, was nun?

Wenn das KMO-Kriterium unter .6 oder .5 liegt, sollten wir noch einmal die Hauptkomponentenanalyse überdenken. Ein so geringes KMO-Kriterium deutet darauf hin, dass eine Hauptkomponentenanalyse nicht angebracht ist und auch nicht durchgeführt werden sollte. Man kann in solchen Fällen zwar trotzdem mit der Analyse fortfahren, aber die Ergebnisse sollten dann mit Vorsicht betrachtet werden. In jede Fall ist auch zu bedenken, dass wir beim Berichten der Ergebnisse das KMO-Kriterium mit angeben müssen. Ein geringer Wert sieht in einer wissenschaftlichen Arbeit nicht gut aus und deutet auf mangelnde methodische Kenntnisse hin.

Anti-Image-Matrizen

Die Anti-Image-Matrizen sind ähnlich des KMO-Kriteriums, nur für einzelne Variablen berechnet. In dieser Tabelle interessieren wir uns für den unteren Teil der Tabelle, dort wo Anti-Image-Korrelation steht. Dort sind die Wert auf der Diagonale für uns interessant (mit einem hochgestellten a markiert und in der Tabelle unten fett).

Die Interpretation dieser Werte erfolgt analog zu der Interpretation des KMO-Kriteriums: Alle Variablen sollten einen Wert von .5 bzw. .6 oder mehr ausweisen.

Hauptkomponentenanalyse: Anti-Image

Bartlett-Test auf Sphärizität

Der Bartlett-Test auf Sphärizität überprüft die Nullhypothese, ob die Korrelationsmatrix eine Identitätsmatrix ist. Damit die Hauptkomponentenanalyse funktionieren kann, muss eine gewisse Beziehung zwischen einigen Variablen bzw. Gruppen von Variablen vorhanden sein. Wenn wir allerdings keine Beziehungen zwischen den Variablen hätten, würde es keinen Sinn machen, überhaupt eine Hauptkomponentenanalyse durchzuführen. Wir wollen also, dass dieser Test signifikant wird, also das p < .05.

Der Bartlett-Test ist für unseren Beispieldatensatz signifikant geworden, daher fahren wir mit der Auswertung fort.

KMO- und Bartlett-Test

Maß der Stichprobeneignung nach Kaiser-Meyer-Olkin. ,867
Bartlett-Test auf Sphärizität Ungefähres Chi-Quadrat 3275,489
df 190
Signifikanz nach Bartlett ,000
Der Bartlett-Test ist besonders anfällig für nicht-normale Daten. Daher, für nicht-normale Daten, könnte das Ergebnis schlicht dies bedeuten, nämlich dass die Daten nicht normalverteilt sind. Der Levene–Test und der Brown–Forsythe–Test sind beides Alternativen zum Bartlett-Test, werden allerdings von SPSS nicht direkt aus diesem Dialogfeld heraus angeboten.
 

Bartlett-Test nicht signifikant, was nun?

Wie auch bei dem KMO-Kriterium, sollte bei einem nicht-signifikanten Bartlett-Test ebenfalls nicht fortgefahren werden. Allerdings sind hierbei auch die Erwägungen bezüglich der Normalverteilung der Daten zu beachten, und es sollte eventuell noch ein anderer Test probiert werden.

Literaturverzeichnis

  1. Cleff, T. (2015). Deskriptive Statistik und Explorative Datenanalyse: Eine computergestützte Einführung mit Excel, SPSS und STATA (3., überarb. u. erw. Aufl. 2015). SpringerLink : Bücher. Wiesbaden: Gabler Verlag.
  2. Field, A. P. (2013). Discovering statistics using IBM SPSS statistics: And sex and drugs and rock ’n‘ roll (4th edition). Los Angeles: Sage.
  3. Hartas, D. (2010). Educational research and inquiry: Qualitative and quantitative approaches. London, New York: Continuum.
  4. Möhring, W., & Schlütz, D. (2013). Handbuch standardisierte Erhebungsverfahren in der Kommunikationswissenschaft. Wiesbaden: Springer VS.
  5. Tabachnick, B. G., & Fidell, L. S. (2013). Using multivariate statistics (6th ed.). Boston: Pearson Education.