Lexikon

Regression zur Mitte

Regression zur Mitte ist ein Phänomen in der Statistik, dass besagt, dass wenn eine Variable in der ersten Messung einen extremen Messwert annimmt, wird der Messwert bei der zweiten Messung tendenziell näher am Mittelwert liegen. Nimmt hingegen die zweite Messung einen extremen Messwert an, wird die erste Messung tendenziell näher am Mittelwert gelegen haben (Stigler, 1997). Um zu vermeiden inkorrekte Schlüsse zu ziehen, sollte Regression zur Mitte beim Design des Experiments und der Auswertung der Daten berücksichtigt werden.

Regression zur Mitte tritt auf, wenn wiederholte Messungen an derselben Versuchsperson oder demselben Fall vorgenommen werden. Es tritt auf, weil Werte mit zufälligen (unsystematischen) Fehlern beobachtet werden. Zufällige Fehler sind nicht-systematische Schwankungen um einen wahren Mittelwert bei einer Versuchsperson. Systematische Fehler hingegen, bei denen die beobachteten Werte durchweg verzerrt sind, sind nicht die Ursache der Regression zur Mitte. Es ist selten, dass Daten ohne zufällige Fehler beobachtet werden, was Regression zur Mitte zu einem häufigen Phänomen macht.

Die Bedingungen unter welchen Regression zur Mitte auftritt hängen davon ab, wie der Begriff mathematisch definiert ist. Fancis Galton war der Erste, der dieses Phänomen bei einfacher linearer Regression beschrieben hat.

Mögliche Probleme

Wenn wir eine Messung bei einem Individuum vornehmen, kann es sein, dass diese Messung durch verschiedene Messfehler beeinflusst wird. Wir sind natürlich an dem wahren Wert der Person interessiert und wollen die Messfehler möglichst gering halten. Dies ist allerdings effektiv nicht möglich.

Wenn wir beispielsweise den Kalziumspiegel im Blut einer Person bestimmen, kann die aktuelle Messung durch verschiedene Faktoren beeinflusst worden sein und daher – in den momentanen Messung – von dem tatsächlichen Wert (also den Wert, den die Person üblicherweise hat), stark abweichen. Unsere Messung ist in diesem Fall nur ein Ausschnitt und daher nicht zwangsläufig richtig.

Beispiel zur Regression zur MitteWenn man wiederholte Messungen bei ein und derselben Versuchsperson beobachtet, folgen auf relativ hohe (oder relativ niedrige) Beobachtungen im Allgemeinen weniger extreme Beobachtungen, die näher am wahren Mittelwert der Versuchsperson liegen. Das Problem im Zusammenhang mit Regression zur Mitte ist die Notwendigkeit, die tatsächliche Veränderung von der erwarteten Veränderung aufgrund der natürlichen Schwankungen zu unterscheiden.

In unserem Beispiel würde ein Wissenschaftler beispielsweise eventuell den Schluss ziehen, dass der Kalziumspielgel von Messung #1 zu Messung #2 angestiegen ist, auch wenn der wahre Kalziumspiegel in Wirklichkeit konstant geblieben ist. Bei der dritten Messung wurde dann ein Kalziumspiegel gemessen, der relativ nahe dem wahren Kalziumspiegel entspricht.

Literaturverzeichnis

  1. Barnett, A. G., van der Pols, J. C., & Dobson, A. J. (2005). Regression to the mean: What it is and how to deal with it. International Journal of Epidemiology, 34(1), 215–220. doi:10.1093/ije/dyh299
  2. Stigler, S. M. (1997). Regression towards the mean, historically considered. Statistical methods in medical research, 6(2), 103–114.

Diesen Eintrag zitieren

Hemmerich, W. (2016). StatistikGuru: Regression zur Mitte. Retrieved from https://statistikguru.de/lexikon/regression-zur-mitte.html
@misc{statistikguru,
    title    = {StatistikGuru},
    subtitle = {Regression zur Mitte},
    year     = {2016},
    month    = {may},
    url      = {https://statistikguru.de/lexikon/regression-zur-mitte.html},
    author   = {Hemmerich, Wanja A.},
    urldate  = {2022-07-07}
}