Kaplan-Meier Überlebenszeitanalyse: Definition und Nomenklatur
Überlebenszeitanalyse ist nicht ein spezifisches statistisches Verfahren. Stattdessen existieren verschiedene statistische Verfahren, die verwendet werden können, um Aussagen über die Zeitdauer bis zum Eintreten eines Ereignisses zu machen. Dadurch, dass Überlebenszeitanalyse ein allgemeines Verfahren ist, was nicht auf die Beobachtung von Überleben beschränkt ist und in vielen anderen Bereichen eingesetzt wird, wird stattdessen oft der Begriff Ereigniszeitanalyse verwendet (seltener auch Verlaufsdatenanalyse, Ereignisdatenanalyse und Verweildaueranalyse). Im industriellen Kontext ist sie oft Teil einer Familie von Verfahren, die zur time-to-failure Analyse verwendet werden, also bis zum Ausfall einer Maschine oder eines Betriebselements.
Hier gehen wir auf vier Begriffe ein, die im Kontext der Überlebenszeitanalyse oft verwendet werden.
Ereignisse
Ereignisse sind abgeschlossene studienrelevante Ausgänge, die einen zeitlichen Verlauf besitzen. Historisch gesehen war der Zeitpunkt, bis ein Patient verstarb, eines der wesentlichsten Ergebnisse, was auch zu dem Namen Überlebenszeitanalyse geführt hat. Allerdings können mit überlebenszeitanalytischen Verfahren prinzipiell alle Ereignisse untersucht werden, die ein fest definiertes Ziel und einen zeitlichen Verlauf besitzen (weshalb auch oft der Begriff Ereigniszeitanalyse verwendet wird).
Zwar wird das Kaplan-Meier Verfahren heute weiterhin vor allem noch im medizinischen Bereich eingesetzt – dort primär um die relative Mortalität zwischen zwei oder mehr Bedingungen statistisch zu vergleichen – allerdings findet das Verfahren mittlerweile auch in anderen Fachrichtungen Einsatz. So wurde die Kaplan-Meier Überlebenszeitanalyse beispielsweise in den
- Wirtschaftswissenschaften eingesetzt, um die Effekte von Arbeitslosengeld auf die Arbeitslosigkeitsdauer zu untersuchen (Pollmann-Schult & Büchel, 2005)
– Ereignis: Wiedereinstellung, - in der Botanik, um den besten Zeitpunkt zum Rückschnitt von Reben zu bestimmen (Camargo Alvarez, Salazar-Gutiérrez, Zapata, Keller, & Hoogenboom, 2018)
– Ereignis: Erneuter Austrieb der Rebe, - und der Mata-Wissenschaft, um zu bestimmen, wie schnell ein Artikel zitiert wird (Hancock & Price, 2016)
– Ereignis: Zitation.
Zeit
Die Zeit ist die Dauer vom Beginn der Studie oder Beobachtung, bis zum Eintritt des Ereignisses oder bis zum Ende der Studie. Sollten Versuchspersonen aus der Studie ausscheiden, wäre die Zeit die Dauer vom Beginn der Studie bis zur letzten Erhebung.
Zensierte Daten
Da die Zeit bei Überlebenszeitanalyse nicht immer bekannt ist, sind viele Daten zensiert.
Zensierung tritt dann auf, wenn wir zwar gewisse Informationen über die individuelle Zeit bis zum Eintritt des Ereignisses haben, aber diese Zeit nicht genau kennen. Versuchsteilnehmer werden in dem Sinne zensiert, dass wir nach dem Zeitpunkt der Zensierung nichts mehr über sie beobachtet können. Das Ereignis könnte aber immer noch nach dem Ende der Beobachtungszeit auftreten oder nicht.
Im nächsten Abschnitt gehen wir noch einmal tiefer auf Zensierung ein und besprechen die verschiedenen Arten von Zensierung und unter welchen Umständen sie auftreten kann.
Überlebensfunktion
Das Ziel der Überlebenszeitanalyse ist es die Überlebensfunktion S(t) zu schätzen. Sie gibt an, wie hoch die Wahrscheinlichkeit ist, dass ein Patient über eine bestimmte Zeit t hinaus überlebt. Allgemeiner ausgedrückt: Sie gibt die Wahrscheinlichkeit an, inwieweit ein Ereignis zum Zeitpunkt t oder darüber hinaus nicht eingetreten ist. Außerhalb des medizinischen Bereichs wird sie auch manchmal als Zuverlässigkeitsfunktion bezeichnet. Da die Überlebensfunktion uns eine Wahrscheinlichkeit liefert, wird sie uns Werte zwischen 0 und 1 geben.
- Zu Beginn der Studie, also zur Zeit t = 0, bei S(0), wird die Wahrscheinlichkeit immer 1 sein. Da unsere Studie gerade erst begonnen hat, ist das Ereignis noch bei keinem Patienten oder Versuchsobjekt aufgetreten.
- t kann Werte von 0 bis ∞ annehmen. Bei einem Wert von t = ∞, wenn wir also quasi die Patienten bzw. Versuchsobjekte unendlich lange untersuchen würden, wäre das Ereignis bei allen aufgetreten, also S(∞) = 0. Dies ist natürlich mehr eine theoretische Überlegung, zeigt aber, wie die Überlebenszeitanalyse funktioniert.
Hazardfunktion
Neben der Überlebensfunktion existiert noch die Hazardfunktion (auch Ausfallrate genannt), die eng mit der Überlebensfunktion verwandt ist. Sie wird meist als h(t) geschrieben.
Man könnte sagen, dass die Hazardfunktion die Wahrscheinlichkeit angibt, dass man, wenn bis zum Zeitpunkt t das Ereignis noch nicht eingetreten ist, es im nächsten Augenblick eintreten wird. Oder anders ausgedrückt: Die Hazardfunktion gibt das momentane Potenzial pro Zeiteinheit für das Eintreten des Ereignisses an, vorausgesetzt, dass das Ereignis bis zum Zeitpunkt t noch nicht eingetreten ist.
Die Hazardfunktion betrachtet damit die andere Seite des Geschehens. Während sich die Überlebensfunktion darauf konzentriert, dass ein Ereignis noch nicht eingetreten ist, betrachtet die Hazardfunktion den Fall, dass ein Ereignis eintritt.
- Sie ist immer nicht-negativ, d. h. gleich oder größer als Null.
- Sie hat keine obere Grenze.
Literaturverzeichnis
- Hancock, C. B., & Price, H. E. (2016). First citation speed for articles in Psychology of Music. Psychology of Music, 44(6), 1454–1470. doi:10.
1177/ 0305735616637133 - Pollmann-Schult, M., & Büchel, F. (2005). Unemployment Benefits, Unemployment Duration and Subsequent Job Quality. Acta Sociologica, 48(1), 21–39. doi:10.
1177/ 0001699305050985 - Camargo Alvarez, H., Salazar-Gutiérrez, M., Zapata, D., Keller, M., & Hoogenboom, G. (2018). Time-to-event analysis to evaluate dormancy status of single-bud cuttings: An example for grapevines. Plant Methods, 14, 94. doi:10.
1186/ s13007- 018- 0361- 0