Wilcoxon-Vorzeichen-Rang-Test: Symmetrie manuell überprüfen
Es ist wichtig zu verstehen, dass SPSS bei der Erstellung des Histogramms für uns einige Entscheidungen getroffen hat, z.B. wie viele Balken es geben soll. Gerade diese Entscheidung wird formelbasiert getroffen, ist aber auch mehr eine Schätzung als eine genaue Wissenschaft. Die Anzahl der Balken (im Histogramm, auch Bins genannt) beeinflusst dabei aber maßgeblich das Aussehen des Histogramms. So kann es beispielsweise sein, dass ein Histogramm zu viele Balken hat und dies den Eindruck erweckt, als sei eine eigentlich symmetrische Verteilung nicht symmetrisch. In der Regel werden symmetrische Verteilungen allerdings auch mit den Standardeinstellungen von SPSS ihr symmetrisches Aussehen weitestgehend bewahren.
Dennoch kann es in einigen Fällen hilfreich sein, manuell die Anzahl der Bins anzupassen, um so potentiell ein besseres Bild über das Aussehen der Verteilung zu erhalten. Allerdings dürfen die Anzahl der Balken auch nicht beliebig gewählt werden, sondern sollten auch gemäß etablierten Standards berechnet werden. Wir haben unterhalb in diesem Artikel einen Rechner zusammengestellt, der die Anzahl der Bins berechnet, basierend auf den Formeln von Freedman & Diaconis (1981) und Scott (1979), zusammen mit einer Videoanleitung, wie man in SPSS ein Histogramm mit benutzerdefinierten Anzahl von Bins erstellt.
Für unseren Beispieldatensatz würden wir die Daten der Differenz beider Variablen in das Feld des Rechners unterhalb kopieren und erhalten so 12 (Freedman & Diaconis, 1981) bzw. 8 (Scott, 1979) Bins, wobei wir uns für die 8 Bins gemäß Scott (1979) bei der Erstellung des Histogramms entscheiden.
Rechner
Anzahl der Bins berechnen
Daten
Anzahl der Bins nach Freedman & Diaconis (1981)
Anzahl der Bins nach Scott (1979)
Anzahl der Bins in SPSS einstellen
Was tun wenn?
Wenn auch die Verteilungs der manuell erstellten Histogramme nicht symmtrisch aussieht, können wir nicht mit der weiteren Analyse fortfahren. Hier empfiehlt es sich statt dem Wilcoxon-Vorzeichen-Rang-Test den Vorzeichentest zu berechnen, da dieser gar keine Voraussetzungen bezüglich der Verteilungsform macht.
Literaturverzeichnis
- Freedman, D., & Diaconis, P. (1981). On the histogram as a density estimator: L 2 theory. Zeitschrift Für Wahrscheinlichkeitstheorie Und Verwandte Gebiete, 57(4), 453–476. doi:10.
1007/ BF01025868 - Scott, D. W. (1979). On Optimal and Data-Based Histograms. Biometrika, 66(3), 605. doi:10.
2307/ 2335182 - Scott, D. W. (1992). Multivariate density estimation: Theory, practice, and visualization. New York: Wiley. doi:10.
1002/ 9780470316849