Chi-Quadrat-Test für Unabhängigkeit: Interpretation der Ergebnisse
Im Folgenden werden wir die Interpretation, Auswertung und das Berichten der Ergebnisse des Chi-Quadrat Test besprechen. In der Ausgabe finden sich drei Tabellen: Verarbeitete Fälle, Kreuztabelle, Chi-Quadrat-Tests und Symmetrische Maße.
Verarbeitete Fälle
Die erste Tabelle ist die der Verarbeiteten Fälle. Hier sehen wir, wie viele Fälle in die Analyse eingeflossen sind, wie viele Fälle inkomplette (fehlende) Daten hatten. In unserem Beispiel sind keine fehlenden Fälle, wir haben daher 100% gültige Datensätze.
Verarbeitete Fälle | ||||||
---|---|---|---|---|---|---|
Fälle | ||||||
Gültig | Fehlend | Gesamt | ||||
N | Prozent | N | Prozent | N | Prozent | |
Geschlecht * Eissorte | 73 | 100,0% | 0 | 0,0% | 73 | 100,0% |
Kreuztabelle
Die zweite Tabelle in der Ausgabe des Chi-Quadrat Tests ist die Kreuztabelle unserer beiden Variablen. Hier sehen wir die erwarteten und die beobachten Häufigkeiten, die die Grundlage für die Berechnung des Chi-Quadrat-Tests sind. Größere Abweichungen der beobachteten (hier rot) von den erwarteten Häufigkeiten (grün) sind ein Indiz für einen signifikanten Test.
Geschlecht * Eissorte Kreuztabelle | |||||
---|---|---|---|---|---|
Eissorte | Gesamt | ||||
Vanille | Schokolade | ||||
Geschlecht | männlich | Anzahl | 21 | 15 | 36 |
Erwartete Anzahl | 16,3 | 19,7 | 36,0 | ||
% innerhalb von Geschlecht | 58,3% | 41,7% | 100,0% | ||
% innerhalb von Eissorte | 63,6% | 37,5% | 49,3% | ||
% der Gesamtzahl | 28,8% | 20,5% | 49,3% | ||
weiblich | Anzahl | 12 | 25 | 37 | |
Erwartete Anzahl | 16,7 | 20,3 | 37,0 | ||
% innerhalb von Geschlecht | 32,4% | 67,6% | 100,0% | ||
% innerhalb von Eissorte | 36,4% | 62,5% | 50,7% | ||
% der Gesamtzahl | 16,4% | 34,2% | 50,7% | ||
Gesamt | Anzahl | 33 | 40 | 73 | |
Erwartete Anzahl | 33,0 | 40,0 | 73,0 | ||
% innerhalb von Geschlecht | 45,2% | 54,8% | 100,0% | ||
% innerhalb von Eissorte | 100,0% | 100,0% | 100,0% | ||
% der Gesamtzahl | 45,2% | 54,8% | 100,0% |
Wir sehen, dass die beobachtete Häufigkeit für Männer bei Vanilleeis und Frauen bei Schokoladeneis deutlich größer ist, als die erwartete. Bei den übrigen beiden Zellen ist das Gegenteil der Fall: Die erwarteten Häufigkeiten sind größer als die beobachteten. Wir erkennen daraus einen möglichen Zusammenhang zwischen den beiden Variablen Geschlecht und bevorzugte Eissorte. Ob dies allerdings tatsächlich der Fall ist, erfahren wir in der nächsten Tabelle.
Chi-Quadrat-Tests
Die nächste Tabelle ist die wichtigste für den Chi-Quadrat-Test. Alle wichtigen Informationen zum Berichten der Ergebnisse können wir hier entnehmen.
Chi-Quadrat-Tests | |||||
Wert | df | Asymptotische Signifikanz (zweiseitig) | Exakte Signifikanz (2-seitig) | Exakte Signifikanz (1-seitig) | |
---|---|---|---|---|---|
Chi-Quadrat nach Pearson | 4,942a | 1 | ,026 | ||
Kontinuitätskorrekturb | 3,951 | 1 | ,047 | ||
Likelihood-Quotient | 4,999 | 1 | ,025 | ||
Exakter Test nach Fisher | ,035 | ,023 | |||
Zusammenhang linear-mit-linear | 4,874 | 1 | ,027 | ||
Anzahl der gültigen Fälle | 73 | ||||
a. 0 Zellen (0,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 16,27. | |||||
b. Wird nur für eine 2×2-Tabelle berechnet |
Wenn wir den Chi-Quadrat Test für zwei dichotome Variablen durchführen (2×2-Kreuztabelle), wie in diesem Beispiel, haben wir die Wahl zwischen dem „normalen“ Chi-Quadrat-Test nach Pearson und dem exakten Test nach Fisher. Die Berechnungen für den exakten Test nach Fisher werden umso komplizierter, je größer die Kreuztabelle ist, können aber im Prinzip auf Kreuztabellen beliebiger Größe angewendet werden (Mehta & Patel, 1983). SPSS bietet für diesen Fall exakte Methoden zur Berechnung, inklusive Monte Carlo Simulation, an.
Es existieren zahlreiche Empfehlungen, wann welcher der Tests zu verwenden ist. Wir empfehlen Fishers exakten Test nur dann zu verwenden, wenn mindestens eine der erwarteten Zellhäufigkeiten unter fünf liegt. Wie wir auch schon vorher überprüft haben (und wie es auch in der ersten Fußnote der Tabelle steht), sind alle erwarteten Zellhäufigkeiten bei unserem Beispieldatensatz größer oder gleich fünf. Wir werden daher den Chi-Quadrat-Test nach Pearson interpretieren.
Effektstärke
Effektstärken gehören zu den wichtigsten Ergebnissen empirischer Studien (Lakens, 2013) und deren Angabe in wissenschaftlichen Publikationen wird beispielsweise von der APA empfohlen (American Psychological Association, 2013). Der Chi-Quadrat-Test sagt uns zwar, ob wir unsere Nullhypothese ablehnen können oder nicht, gibt allerdings keine Auskunft über die Stärke des Zusammenhangs. Effektstärken machen genau dies: Sie sagen uns, wie stark der Zusammenhang ist, bzw. wie groß der Effekt ist. In der Tabelle Symmetrische Maße berechnet SPSS zwei Effektstärkenmaße für uns.
Symmetrische Maße | |||
---|---|---|---|
Wert | Näherungsweise Signifikanz | ||
Nominal- bzgl. Nominalmaß | Phi | ,260 | ,026 |
Cramer-V | ,260 | ,026 | |
Anzahl der gültigen Fälle | 73 |
Sowohl der Phi-Koeffizient (φ), als auch Cramér’s V sind Maße für die Stärke des Zusammenhangs von zwei nominal skalierten Variablen. Der Phi-Koeffizient sollte nur verwendet werden, wenn wir eine 2×2 Kreuztabelle haben, also wenn beide Variablen dichotom sind, wie in unserem Beispiel. Der Phi-Koeffizient ist identisch mit Cramér’s V, wenn wir eine 2×2 Kreuztabelle haben. Für alle anderen Fälle sollten wir Cramér’s V verwenden. Beide Effektstärkenmaße können nach Cohen (1988) ähnlich einer Korrelation interpretiert werden.
Interpretation vom Phi-Koeffizienten (φ) und Cramér’s V nach Cohen (1988) | |
---|---|
kleiner Effekt | φ, V = 0.1 |
mittlerer Effekt | φ, V = 0.3 |
großer Effekt | φ, V = 0.5 |
Allerdings kann Cramér’s V nur Werte zwischen 0 und +1 annehmen, während der Phi-Koeffizient Werte zwischen -1 und +1 annehmen kann.
Ergebnisse berichten
Ein Chi-Quadrat-Test wurde zwischen Geschlecht und präferierter Eissorte durchgeführt. Keine erwarteten Zellhäufigkeiten waren kleiner als 5. Es gab einen statistisch signifikanten Zusammenhang zwischen Geschlecht und präferierter Eissorte, χ²(1) = 4.94, p = .026, φ = 0.26.
English
A chi-square test was used to compare gender and prefered ice cream flavor. No expected cell frequencies were below 5. Results show a significant between gender and prefered ice cream flavor, χ²(1) = 4.94, p = .026, φ = 0.26
Der wichtigste Teil bei der Angabe der Ereignisse ist folgende Zeile: χ²(1) = 4.94, p = .026, φ = 0.26. Sie setzt sich aus Werten der Tabellen des Chi-Quadrat-Tests und der Symmetrischen Maße zusammen und zwar so:
Chi-Quadrat-Tests | |||||
Wert | df | Asymptotische Signifikanz (zweiseitig) | Exakte Signifikanz (2-seitig) | Exakte Signifikanz (1-seitig) | |
---|---|---|---|---|---|
Chi-Quadrat nach Pearson | 4,942a | 1 | ,026 | ||
Kontinuitätskorrekturb | 3,951 | 1 | ,047 | ||
Likelihood-Quotient | 4,999 | 1 | ,025 | ||
Exakter Test nach Fisher | ,035 | ,023 | |||
Zusammenhang linear-mit-linear | 4,874 | 1 | ,027 | ||
Anzahl der gültigen Fälle | 73 | ||||
a. 0 Zellen (0,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 16,27. | |||||
b. Wird nur für eine 2×2-Tabelle berechnet |
χ²(1) = 4.94, p = .026, φ = 0.26
χ²(Freiheitsgrade) = Teststatistik, p = Signifikanz, Cramér’s V / φ = Effektstärke
Aufschlüsselung der einzelnen Werte
- χ²: Das χ² gibt an, dass das Testverfahren eine Chi-Quadrat-Verteilung verwendet
- (1): Das Aussehen (und damit auch die Grenze der Signifikanz) der Chi-Quadrat-Verteilung wird durch diesen Parameter beeinflusst. Er entspricht den Freiheitsgraden.
- 4.94: Der Wert der Teststatistik, der in der Chi-Quadrat-Verteilung nachgeschlagen wird um den p-Wert zu berechnen
- .026: Der p-Wert, der die Signifikanz wiedergibt
Literaturverzeichnis
- American Psychological Association. (2013). APA Manual 6th ed (Publication manual of the American Psychological Association) (6th ed.). Washington, DC: American Psychological Association.
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, N.J.: L. Erlbaum Associates.
- Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science: a practical primer for t-tests and ANOVAs. Frontiers in psychology, 4, 863. doi:10.
3389/ fpsyg. 2013. 00863 - Mehta, C. R., & Patel, N. R. (1983). A Network Algorithm for Performing Fisher’s Exact Test in r × c Contingency Tables. Journal of the American Statistical Association, 78(382), 427. doi:10.
2307/ 2288652