Hauptkomponentenanalyse

Hauptkomponentenanalyse: Voraussetzungen

Im Gegensatz zu anderen statistischen Verfahren, besitzt die Hauptkomponentenanalyse nur wenige Voraussetzungen, die wir vorab überprüfen können. Die meisten Voraussetzungen sind Tests, die sich in der Auswahl von SPSS befinden und zusammen mit der eigentlichen Analyse berechnet werden. Es gibt allerdings einige allgemeine Voraussetzungen, die erfüllt sein sollten:

  1. Die Beziehung zwischen den Variablen sollte linear sein
  2. Es sollten sich keine Ausreißer in den Daten befinden
  3. Die Variablen sollten stetig sein (allerdings werden auch oft Ordinaldaten verwendet)
  4. Je größer die Stichprobe, desto präziser das Ergebnis

Besonders beim letzten Punkt, der Mindeststichprobengröße, scheiden sich die Geister. Es existieren Empfehlungen von 4 Fällen pro analysierter Variablen (Little, 2013, p. 742), bis hin zu 20 Fällen pro Variablen. Andere Autoren empfehlen eine Mindeststichprobengröße, die nicht abhängig von der Anzahl der Variablen ist, sondern auf einem generellen Minimum an Fällen aufbaut (MacCallum, Widaman, Zhang, and Hong, 1999).

Da Hauptkomponentenanalyse für einige Berechnungen Korrelationen verwendet, sind die Voraussetzungen beider Verfahren ähnlich. Die ersten drei Voraussetzungen aus der Liste finden sich auch bei der Pearson Produkt-Moment-Korrelation wieder. In dieser Anleitung werden wir sie nicht separat überprüfen. Da wir bei der Hauptkomponentenanalyse oft mit sehr großen Datensätzen arbeiten, ist es auch entsprechend aufwändig, die Voraussetzungen für alle beteiligten Variablen zu überprüfen. Wir empfehlen daher, erst die Hauptkomponentenanalyse durchzuführen. Falls unerwartete (oder gar keine) Strukturen auftauchen, können wir zurückgehen und die Variablen auf die Voraussetzungen überprüfen. Eine entsprechende Anleitung dazu findet sich bei der Pearson Produkt-Moment-Korrelation.

Literaturverzeichnis

  1. Little, T. D. (2013). The Oxford handbook of quantitative methods. Oxford library of psychology. Oxford: Oxford University Press.
  2. MacCallum, R. C., Widaman, K. F., Zhang, S., & Hong, S. (1999). Sample size in factor analysis. Psychological Methods, 4(1), 84–99. doi:10.1037/1082-989X.4.1.84
  3. Schumacker, R. E. (2015). Using R With Multivariate Statistics. Thousand Oaks: SAGE Publications, Inc.