Rechner

Median-Split Rechner

Median-Splits sind die wahrscheinlich beliebteste statistische Methode zur Dichotomisierung von Variablen. Dabei wird eine Variable entlang des Medians in zwei (meist gleichgroße) Gruppen eingeteilt. Allerdings existieren auch kritische Meinungen zum Einsatz des Median-Splits, die wir weiter unten diskutieren.

Dieser Rechner berechnet die Cut-Off Werte für die Einteilung in zwei oder auch wahlweise drei Gruppen und gibt den entsprechenden SPSS-Syntax automatisch aus.

Median-Split Rechner

Einfach eine Variable aus SPSS (wie weiter unter beschrieben) in das Textfeld kopieren und die Transformationsformel berechnen lassen. Die Anzahl der Fälle ist auf 10.000 beschränkt. Alle Fälle darüber hinaus werden nicht berücksichtigt. Das Ergebnis wird direkt darunter eingeblendet.


Klassischer Median-Split: die Daten werden in zwei Gruppen aufgeteilt.
Aufteilung in drei Gruppen: niedrig, mittel und hoch.

Median-Split durchführen

Datenauswahl von SPSS

  1. In der Datenansicht zuerst eine Variable mit einem Klick auf den Variablennamen auswählen, sodass die gesamte Variable gelb markiert ist.

    Box-Cox Variable selektieren


  2. Mit Bearbeiten > Kopieren werden die Daten in die Zwischenablage kopiert.

    Box-Cox Variable kopieren


  3. Daten dann in das Textfeld einfügen und Berechnung durchführen.

    Box-Cox Daten einfügen


Kritik

Wissenschaftler diskutieren immer wieder den Sinn und die Rechtmäßigkeit von Median-Splits. Dabei existieren zwei große Kritikpunkte, die gegen die Verwendung von Median-Splits sprechen.

Informationsverlust durch Median-Splits

Meistens werden kontinuierliche Variablen dichotomisiert. Die Variable hat dabei . Gehen wir einmal davon aus, dass wir Spielverhalten untersuchen möchten und dabei die Anzahl der Stunden erheben, die Teilnehmer jede Woche mit Computerspielen verbringen. Es wurden insgesamt 112 Teilnehmer untersucht die von 0 bis 34 Stunden jede Woche spielen, mit einem Median von 5 Stunden. Das Problem hierbei ist, dass wir nach der Durchführung des Median-Splits eine Person die 7 Stunden spielt in dieselbe Gruppe zuweisen, wie eine Person die 34 Stunden spielt. Je nachdem wie groß die Spanne ist, wird hier bemängelt, dass der Informationsverlust nach dem Split zu groß ist und die Nuancen des Stichprobe nicht mehr adäquat widerspiegelt.

Eine mögliche Lösung hier ist, die Stichprobe nicht in zwei Gruppen zu unterteilen, sondern in drei und dann die mittlere Gruppe bei der Analyse nicht zu berücksichtigen. Somit hätten wir eine Aufteilung nach niedrig, mittel und hoch und könnten niedrig vs. hoch analysieren. Der offensichtliche Nachteil hierbei ist, dass wir ein drittel unserer Stichprobe verlieren. Gerade bei kleineren Stichproben kann dies massive Auswirkungen haben.

Powerverlust durch Median-Splits

Der zweite Kritikpunkte bezieht sich auf die statistische Power. Eine potenziell problematische Folge des Verlusts von Informationen ist, dass nachfolgende Analysen möglicherweise weniger wahrscheinlich sind, Unterstützung für Hypothesen zu finden, da Median-Splits die Wahrscheinlichkeit von Typ-II-Fehlern erhöhen können, indem sie Effektgrößen und statistische Power reduzieren (Humphreys, 1978; Lagakos, 1988). Cohen (1983) zeigte die Wirkung von Median-Splits auf Korrelationskoeffizienten. Bei zwei bivariate normalverteilte Variablen, X und Y, war die resultierende Korrelation nur 0,798 (oder etwa 80 %) der Ursprünglichen, nachdem die Variablen dichotomisiert wurden.

Licht am Horizont

Trotz der Gegenargumente bleiben Median-Splits weiterhin beliebt. Und es gibt auch Wissenschaftler, die den Einsatz von Median-Splits weiterhin empfehlen, wie jüngstens beispielsweise Iacobucci, Posavac, Kardes, Schneider, & Popovich (2015a). Sie argumentieren, dass Median-Splits vollkommen akzeptabel sind, bei unkorrelierten unabhängige Variablen. In einem weiteren Kommentar gingen die Autoren auf Kritikpunkte ein und verteidigten den Median-Split (Iacobucci, Posavac, Kardes, Schneider, & Popovich, 2015b).

Literaturverzeichnis

  1. Cohen, J. (1983). The Cost of Dichotomization. Applied Psychological Measurement, 7(3), 249–253. doi:10.1177/014662168300700301
  2. Humphreys, L. G. (1978). Doing research the hard way: Substituting analysis of variance for a problem in correlational analysis. Journal of Educational Psychology, 70(6), 873–876. doi:10.1037/0022-0663.70.6.873
  3. Iacobucci, D., Posavac, S. S., Kardes, F. R., Schneider, M. J., & Popovich, D. L. (2015a). Toward a more nuanced understanding of the statistical properties of a median split. Journal of Consumer Psychology, 25(4), 652–665. doi:10.1016/j.jcps.2014.12.002
  4. Iacobucci, D., Posavac, S. S., Kardes, F. R., Schneider, M. J., & Popovich, D. L. (2015b). The median split: Robust, refined, and revived. Journal of Consumer Psychology, 25(4), 690–704.  doi:10.1016/j.jcps.2015.06.014
  5. Lagakos, S. W. (1988). Effects of mismodelling and mismeasuring explanatory variables on tests of their association with a response variable. Statistics in Medicine, 7(1-2), 257–274. doi:10.1002/sim.4780070126