χ² (Chi-Quadrat) Test für Unabhängigkeit

Chi-Quadrat-Test für Unabhängigkeit: Interpretation der Ergebnisse

Im Folgenden werden wir die Interpretation, Auswertung und das Berichten der Ergebnisse des Chi-Quadrat Test besprechen. In der Ausgabe finden sich drei Tabellen: Verarbeitete Fälle, Kreuztabelle, Chi-Quadrat-Tests und Symmetrische Maße.

Verarbeitete Fälle

Die erste Tabelle ist die der Verarbeiteten Fälle. Hier sehen wir, wie viele Fälle in die Analyse eingeflossen sind, wie viele Fälle inkomplette (fehlende) Daten hatten. In unserem Beispiel sind keine fehlenden Fälle, wir haben daher 100% gültige Datensätze.

Verarbeitete Fälle
Fälle
Gültig Fehlend Gesamt
N Prozent N Prozent N Prozent
Geschlecht * Eissorte 73 100,0% 0 0,0% 73 100,0%

Kreuztabelle

Die zweite Tabelle in der Ausgabe des Chi-Quadrat Tests ist die Kreuztabelle unserer beiden Variablen. Hier sehen wir die erwarteten und die beobachten Häufigkeiten, die die Grundlage für die Berechnung des Chi-Quadrat-Tests sind. Größere Abweichungen der beobachteten (hier rot) von den erwarteten Häufigkeiten (grün) sind ein Indiz für einen signifikanten Test.

Geschlecht * Eissorte Kreuztabelle
Eissorte Gesamt
Vanille Schokolade
Geschlecht männlich Anzahl 21 15 36
Erwartete Anzahl 16,3 19,7 36,0
% innerhalb von Geschlecht 58,3% 41,7% 100,0%
% innerhalb von Eissorte 63,6% 37,5% 49,3%
% der Gesamtzahl 28,8% 20,5% 49,3%
weiblich Anzahl 12 25 37
Erwartete Anzahl 16,7 20,3 37,0
% innerhalb von Geschlecht 32,4% 67,6% 100,0%
% innerhalb von Eissorte 36,4% 62,5% 50,7%
% der Gesamtzahl 16,4% 34,2% 50,7%
Gesamt Anzahl 33 40 73
Erwartete Anzahl 33,0 40,0 73,0
% innerhalb von Geschlecht 45,2% 54,8% 100,0%
% innerhalb von Eissorte 100,0% 100,0% 100,0%
% der Gesamtzahl 45,2% 54,8% 100,0%

Wir sehen, dass die beobachtete Häufigkeit für Männer bei Vanilleeis und Frauen bei Schokoladeneis deutlich größer ist, als die erwartete. Bei den übrigen beiden Zellen ist das Gegenteil der Fall: Die erwarteten Häufigkeiten sind größer als die beobachteten. Wir erkennen daraus einen möglichen Zusammenhang zwischen den beiden Variablen Geschlecht und bevorzugte Eissorte. Ob dies allerdings tatsächlich der Fall ist, erfahren wir in der nächsten Tabelle.

Chi-Quadrat-Tests

Die nächste Tabelle ist die wichtigste für den Chi-Quadrat-Test. Alle wichtigen Informationen zum Berichten der Ergebnisse können wir hier entnehmen.

Chi-Quadrat-Tests
Wert df Asymptotische Signifikanz (zweiseitig) Exakte Signifikanz (2-seitig) Exakte Signifikanz (1-seitig)
Chi-Quadrat nach Pearson 4,942a 1 ,026
Kontinuitätskorrekturb 3,951 1 ,047
Likelihood-Quotient 4,999 1 ,025
Exakter Test nach Fisher ,035 ,023
Zusammenhang linear-mit-linear 4,874 1 ,027
Anzahl der gültigen Fälle 73
a. 0 Zellen (0,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 16,27.
b. Wird nur für eine 2×2-Tabelle berechnet

Wenn wir den Chi-Quadrat Test für zwei dichotome Variablen durchführen (2×2-Kreuztabelle), wie in diesem Beispiel, haben wir die Wahl zwischen dem „normalen“ Chi-Quadrat-Test nach Pearson und dem exakten Test nach Fisher. Die Berechnungen für den exakten Test nach Fisher werden umso komplizierter, je größer die Kreuztabelle ist, können aber im Prinzip auf Kreuztabellen beliebiger Größe angewendet werden (Mehta & Patel, 1983). SPSS bietet für diesen Fall exakte Methoden zur Berechnung, inklusive Monte Carlo Simulation, an.

Es existieren zahlreiche Empfehlungen, wann welcher der Tests zu verwenden ist. Wir empfehlen Fishers exakten Test nur dann zu verwenden, wenn mindestens eine der erwarteten Zellhäufigkeiten unter fünf liegt. Wie wir auch schon vorher überprüft haben (und wie es auch in der ersten Fußnote der Tabelle steht), sind alle erwarteten Zellhäufigkeiten bei unserem Beispieldatensatz größer oder gleich fünf. Wir werden daher den Chi-Quadrat-Test nach Pearson interpretieren.

Effektstärke

Effektstärken gehören zu den wichtigsten Ergebnissen empirischer Studien (Lakens, 2013) und deren Angabe in wissenschaftlichen Publikationen wird beispielsweise von der APA empfohlen (American Psychological Association, 2013). Der Chi-Quadrat-Test sagt uns zwar, ob wir unsere Nullhypothese ablehnen können oder nicht, gibt allerdings keine Auskunft über die Stärke des Zusammenhangs. Effektstärken machen genau dies: Sie sagen uns, wie stark der Zusammenhang ist, bzw. wie groß der Effekt ist. In der Tabelle Symmetrische Maße berechnet SPSS zwei Effektstärkenmaße für uns.

Symmetrische Maße
Wert Näherungsweise Signifikanz
Nominal- bzgl. Nominalmaß Phi ,260 ,026
Cramer-V ,260 ,026
Anzahl der gültigen Fälle 73

Sowohl der Phi-Koeffizient (φ), als auch Cramér’s V sind Maße für die Stärke des Zusammenhangs von zwei nominal skalierten Variablen. Der Phi-Koeffizient sollte nur verwendet werden, wenn wir eine 2×2 Kreuztabelle haben, also wenn beide Variablen dichotom sind, wie in unserem Beispiel. Der Phi-Koeffizient ist identisch mit Cramér’s V, wenn wir eine 2×2 Kreuztabelle haben. Für alle anderen Fälle sollten wir Cramér’s V verwenden. Beide Effektstärkenmaße können nach Cohen (1988) ähnlich einer Korrelation interpretiert werden.

Interpretation vom Phi-Koeffizienten (φ) und Cramér’s V nach Cohen (1988)
kleiner Effekt φ, V = 0.1
mittlerer Effekt φ, V = 0.3
großer Effekt φ, V = 0.5

Allerdings kann Cramér’s V nur Werte zwischen 0 und +1 annehmen, während der Phi-Koeffizient Werte zwischen -1 und +1 annehmen kann.

Ergebnisse berichten

Deutsch
Ein Chi-Quadrat-Test wurde zwischen Geschlecht und präferierter Eissorte durchgeführt. Keine erwarteten Zellhäufigkeiten waren kleiner als 5. Es gab einen statistisch signifikanten Zusammenhang zwischen Geschlecht und präferierter Eissorte, χ²(1) = 4.94, p = .026, φ = 0.26.
English
A chi-square test was used to compare gender and prefered ice cream flavor. No expected cell frequencies were below 5. Results show a significant between gender and prefered ice cream flavor, χ²(1) = 4.94, p = .026, φ = 0.26
Auch wenn SPSS in der Spalte Signifikanz einen Wert von .000 angibt, ist dies nur ein gerundeter Wert (Signifikanzen können weder den Wert 0 noch 1 annehmen, sondern liegen immer dazwischen.) Bei einem Wert von .000 würden wir dies als p < .001 schreiben. Das APA-Handbuch empfiehlt ansonsten die Angabe genauer p-Werte (gerundet auf drei Nachkommastellen).

Der wichtigste Teil bei der Angabe der Ereignisse ist folgende Zeile: χ²(1) = 4.94, p = .026, φ = 0.26. Sie setzt sich aus Werten der Tabellen des Chi-Quadrat-Tests und der Symmetrischen Maße zusammen und zwar so:

Chi-Quadrat-Tests
Wert df Asymptotische Signifikanz (zweiseitig) Exakte Signifikanz (2-seitig) Exakte Signifikanz (1-seitig)
Chi-Quadrat nach Pearson 4,942a 1 ,026
Kontinuitätskorrekturb 3,951 1 ,047
Likelihood-Quotient 4,999 1 ,025
Exakter Test nach Fisher ,035 ,023
Zusammenhang linear-mit-linear 4,874 1 ,027
Anzahl der gültigen Fälle 73
a. 0 Zellen (0,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 16,27.
b. Wird nur für eine 2×2-Tabelle berechnet

χ²(1) = 4.94, p = .026, φ = 0.26

χ²(Freiheitsgrade) = Teststatistik, p = Signifikanz, Cramér’s V / φ = Effektstärke

Aufschlüsselung der einzelnen Werte

  • χ²: Das χ² gibt an, dass das Testverfahren eine Chi-Quadrat-Verteilung verwendet
  • (1): Das Aussehen (und damit auch die Grenze der Signifikanz) der Chi-Quadrat-Verteilung wird durch diesen Parameter beeinflusst. Er entspricht den Freiheitsgraden.
  • 4.94: Der Wert der Teststatistik, der in der Chi-Quadrat-Verteilung nachgeschlagen wird um den p-Wert zu berechnen
  • .026: Der p-Wert, der die Signifikanz wiedergibt

Literaturverzeichnis

  1. American Psychological Association. (2013). APA Manual 6th ed (Publication manual of the American Psychological Association) (6th ed.). Washington, DC: American Psychological Association.
  2. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, N.J.: L. Erlbaum Associates.
  3. Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science: a practical primer for t-tests and ANOVAs. Frontiers in psychology, 4, 863. doi:10.3389/fpsyg.2013.00863
  4. Mehta, C. R., & Patel, N. R. (1983). A Network Algorithm for Performing Fisher’s Exact Test in r × c Contingency Tables. Journal of the American Statistical Association, 78(382), 427. doi:10.2307/2288652