Autokorrelation
Autokorrelation (oder auch manchmal Kreuzautokorrelation) ist gegeben, wenn Beobachtungen in einer Zeitreihe nicht unabhängig voneinander sind. Genauer gesagt liegt Autokorrelation vor, wenn ein Teil einer Zeitreihe mit sich selbst zu einem anderen Zeitpunkt korreliert (dieser Zeitpunkt kann sowohl in der Vergangenheit, als auch der Zukunft liegen). Man könnte Autokorrelation deshalb auch „verzögerte Korrelation“ nennen.
Wenn das Vorzeichen und die Größe der Residuen nicht mit dem Vorzeichen und der Größe der darauf folgenden Residuen in Beziehung stehen, gibt es keine Autokorrelation, und dies impliziert, dass die Fehler des Modells unabhängig sind.
Wenn jedoch auf positive Residuen in der Zeit eher positive Residuen und auf negative Residuen eher negative Residuen folgen, wird die Autokorrelation positiv sein; dies ist ein Indiz dafür, dass die Residuen nicht unabhängig voneinander sind. Wenn auf positive Residuen tendenziell negative Residuen folgen und auf negative Residuen tendenziell positive Residuen folgen, wird die Autokorrelation negativ sein, was ebenfalls wiederum ein Indiz dafür ist, dass die Residuen nicht unabhängig voneinander sind.
Autokorrelierte Fehler treten insbesondere dann auf, wenn
- die Zeit zwischen den Beobachtungen sehr kurz ist,
- sich das Antwortverhalten nur sehr langsam verändert,
- wichtige Prädiktorvariablen aus dem Modell herausgelassen werden oder
- die funktionale Form (z.B. linear) der Beziehung zwischen den Prädiktoren und dem Antwortergebnis falsch spezifiziert ist.
Durbin–Watson Statistik
Eine Möglichkeit das Ausmaß der Autokorrelation zu bestimmen, bietet die Durbin–Watson Statistik. Sie wird anhand der Residuen e wie folgt berechnet:
\(D = \dfrac{\displaystyle\sum_{i=2}^{N}\left ( e_i-e_{i-1} \right )^2}{\displaystyle\sum_{i=1}^{N}e_{i}^{2}}, \quad\rho_1 \approx \dfrac{-D+2}{2}\)
wobei ei das Residuum zum Zeitpunkt i ist und N die Anzahl der Residuen in der beobachteten Zeitreihe ist. ρ ist der (geschätze) Korrelationskoeffizient der Residuen.
Obwohl man Autokorrelation auf viele verschiedene Arten berechnen kann, beinhaltet die am häufigsten angewandte Methode die Berechnung eines einzelnen Koeffizienten, der als lag-1 Autokorrelationskoeffizient bezeichnet wird. Dieser Autokorrelationskoeffizient stellt die Korrelation zwischen den Residuen zu ihrer zugehörigen Zeit i und denselben Residuen, die um eine Zeiteinheit nach vorne verschoben sind, dar.
Für einfachere Interpretation kann die Durbin–Watson Statistik in einen Pearson Korrelationskoeffizienten umgerechnet werden.
Wert der Statistik | Korrelation | Interpretation |
---|---|---|
d = 2 | ρ = 0 | keine Autokorrelation |
d = 0 | ρ = 1 | perfekte positive Autokorrelation |
d = 4 | ρ = -1 | perfekte negative Autokorrelation |
Unterschiede zwischen Autokorrelation verschiedener Modelle
Manchmal schätzen Forscher Autokorrelation eher anhand der abhängiger Variablen als anhand der Residuen. Es ist wichtig zwischen diesen beiden Ansätzen zu unterscheiden. Bei dem als Auto-Regressive Integrated Moving Average (ARIMA) bezeichneten Ansatz ist die Autokorrelation zwischen den Scores der abhängigen Variablen relevant.
Bei dem als Zeitreihenregression bekannten Ansatz ist die Autokorrelation zwischen den Residuen eines Regressionsmodells relevant. Obwohl beide Ansätze die Berechnung von Autokorrelationsmaßen erfordern, verwenden sie Informationen über die Autokorrelation für unterschiedliche Zwecke.
ARIMA-Modelle verwenden Autokorrelationsmaße, um die Art der Zeitreihenparameter zu identifizieren, die für die Modellierung der Scores der abhängigen Variablen erforderlich sind. Im Gegensatz dazu verwendet die meisten Modelle für Zeitreihenregression Autokorrelation, um zu bestimmen, ob die Residuen des Regressionsmodells unabhängig sind. Bei diesen Regressionsmodellen sollte eine signifikante Autokorrelation Forscher warnen, dass sie das Modell falsch spezifiziert haben (d.h. ein wesentlich falsches Modell gewählt haben) und dass alternative Modelle in Betracht gezogen werden sollten. Dieses alternative Modell sollte Parameter enthalten, die entweder (a) die Autokorrelation unter den Residuen eliminiert oder (b) diese Autokorrelation im Modell selbst berücksichtigt.
Diesen Eintrag zitieren
@misc{statistikguru, title = {StatistikGuru}, subtitle = {Autokorrelation}, year = {2016}, month = {may}, url = {https://statistikguru.de/lexikon/autokorrelation.html}, author = {Hemmerich, Wanja A.}, urldate = {2023-03-29} }