Hauptkomponentenanalyse

Einstieg in die Hauptkomponentenanalyse

Die Hauptkomponentenanalyse (englisch: principal component analysis, PCA) ist das wahrscheinlich meist verwendete multivariate statistische Verfahren und wird von fast allen wissenschaftlichen Fachrichtungen eingesetzt. Hauptkomponentenanalyse analysiert einen Datensatz mit verschiedenen abhängigen Variablen, die in der Regel interkorreliert sind. Ziel ist es, die wichtigste Information des Datensatzes zu extrahieren und diese Information in Form einer geringeren Anzahl an Variablen, den Hauptkomponenten, auszudrücken, die einen Großteil der Varianz des ursprünglichen Datensatzes erklären.

In dieser Anleitung werden wir oft die Begriffe Komponente und Faktor verwenden. Beide Begriffe sind synonym und werden verwendet, wobei der Begriff Komponente eher von SPSS verwendet wird, während Faktor umfangreicher eingesetzt wird.

Themenüberblick

Im ersten Teil werden wir weitere Beispiele über mögliche Anwendungen der Hauptkomponentenanalyse geben. In dem Abschnitt Daten zeigen wir, wie die Daten aufbereitet sein müssen, damit wir damit eine Hauptkomponentenanalyse berechnen können. Hier findet sich auch zusätzlich ein Beispieldatensatz, den wir für alle Berechnungen verwenden werden.

Sobald wir die Daten bereit haben, überprüfen wir, ob alle Voraussetzungen der Hauptkomponentenanalyse erfüllt sind. Bei Verletzungen einzelner Voraussetzungen existieren auch teilweise Korrekturen und Maßnahmen, die wir ebenfalls dort besprechen. Danach kann die eigentliche Datenanalyse beginnen. Die Hauptkomponentenanalyse besitzt zahlreiche Rotationen, auf die wir ebenfalls näher eingehen werden. Jeden einzelnen Schritt zur Durchführung der Hauptkomponentenanalyse besprechen wir jeweils mit Screenshots.

Schlussendlich müssen die Ergebnisse unserer Datenauswertung noch interpretiert und berichtet werden. Dies tun wir im letzten Teil. Entsprechende Musterformulierungen in deutscher und englischer Sprache stehen zur Verfügung.

Weiterführende Literatur

  1. Grimm, L. G., & Yarnold, P. R. (1995). Reading and understanding multivariate statistics. Washington, D.C.: American Psychological Association.
  2. Izenman, A. J. (2008). Modern multivariate statistical techniques: Regression, classification, and manifold learning. New York: Springer.
  3. Ringnér, M. (2008). What is principal component analysis?. Nature biotechnology, 26(3), 303-304. doi:10.1038/nbt0308-303