Lexikon

Missing Completely at Random (MCAR)

Bei Umfragen oder Erhebungen gibt es immer wieder Datenpunkte, die fehlen. Daten, die Missing Completely at Random (MCAR; englisch: vollkommen willkürlich fehlend) sind, stehen mit keiner anderen Variable systematisch in Zusammenhang. Anders ausgedrückt: MCAR bedeutet, dass das Fehlen einer Beobachtung nichts mit der untersuchten Person oder dem untersuchten Objekt zu tun hat. Zum Beispiel könnte ein Fragebogen auf dem Postweg verloren gehen oder eine Gewebeprobe könnte beschädigt werden, weil ein Labortechniker seinen Kaffee verschüttet hat. In beiden Fällen würde der Datenpunkt fehlen und das Fehlen wäre vollkommen zufällig zustandegekommen.

In der Praxis sind Datensätze, in denen Daten völlig zufällig fehlen, eher selten. Am häufigsten lässt es sich daran erkennen, dass das Fehlen auf Ursachen zurückzuführen ist, die nicht vorhersehbar sind und im weitesten Sinne als versehentlich angesehen werden könnte.

Die meisten Situationen, in denen Werte fehlen, sind jedoch weniger eindeutig als die beiden Beispiele oben. Tests auf Zufälligkeit wurden von Diggle (1989), Ridout (1991) und Listing & Schlittgen (2003) vorgeschlagen, und verschiedene Mechanismen für fehlende Daten werden in Little & Rubin (2002) beschrieben.

MCAR ist ebenfalls eine Voraussetzung von vielen Imputationsverfahren, beispielsweise auch Last Observation Carried Forward (LOCF, siehe auch Barnes et al., 2008), die allerdings in den meisten fällen weder erfüllt, noch überprüft wird.

Literaturverzeichnis

  1. Barnes, S. A., Mallinckrodt, C. H., Lindborg, S. R., & Carter, M. K. (2008). The impact of missing data and how it is handled on the rate of false-positive results in drug development. Pharmaceutical Statistics, 7(3), 215–225. doi:10.1002/pst.310
  2. Bland, M. (2015). An introduction to medical statistics (4th ed.). Oxford University Press.
  3. Diggle, P. J. (1989). Testing for Random Dropouts in Repeated Measurement Data. Biometrics, 45(4), 1255. doi:10.2307/2531777
  4. Listing, J., & Schlittgen, R. (2003). A Nonparametric Test for Random Dropouts. Biometrical Journal, 45(1), 113–127. doi:10.1002/bimj.200290010
  5. Ridout, M. S. (1991). Testing for random dropouts in repeated measurement data. Biometrics, 47(4), 1617-1621. doi:10.2307/2532413