Kaplan-Meier

Kaplan-Meier Überlebenszeitanalyse: Zensierte Daten

Die meisten gängigen statistischen Analysen beruhen auf der tatsächlichen Beobachtung von Messwerten. Dennoch kann es vorkommen, dass ein Ereignis nicht in seiner Gesamtheit erfasst wird und der genaue Zeitpunkt, zu dem ein Ereignis eingetreten ist, dadurch unbekannt ist. Wenn dies der Fall ist, spricht man von zensierten Daten.

Es gibt drei gängige Arten von zensierten Daten:

  1. rechte Zensierung bzw. rechtszensierte Daten,
  2. linke Zensierung bzw. linkszensierte Daten und
  3. Intervallzensierung bzw. intervallzensierte Daten.

Es gibt viele verschiedene Grüne, weshalb zensierte Daten auftreten können. Beispielsweise können Versuchspersonen bei einer randomisiert kontrollierten Studie erfahren ob sie in der Versuchs- oder Kontrollgruppe sind (Rosen et al., 2020). Besonders bei Medikamenten mit starken Nebenwirkungen würden sie entsprechend früh aus der Studie ausscheiden. Gleichzeitig kann es aber sein, dass bei einer Medikamentenstudie eine hohe Wirksamkeit festgestellt wird. Hier könnten Probanden aus der Kontrollgruppe aus Unzufriedenheit ausscheiden. Eine frühe Zensierung tritt bevorzugt im Kontrollarm auf, während eine späte Zensierung bevorzugt im Versuchsarm auftritt (Rosen et al., 2020).

Linkszensierte Daten

Sie treten jeweils in unterschiedlichen Kontexten auf. Eine Beobachtung kann z. B. linkszensiert sein, wenn eine Studie durchgeführt wird, die messen soll, wie lange es dauert, bis Säuglinge eine bestimmte Fähigkeit entwickeln; wenn die Säuglinge gemessen werden, haben einige diese Fähigkeit aber eventuell bereits erworben. In diesem Fall ist die genaue Zeit bis zur Entwicklung dieser Fähigkeit für diesen Säugling nicht bekannt – es ist aber klar, dass die Zeit kürzer als das Alter des Säuglings sein muss. Auch wenn der genaue Zeitpunkt unbekannt ist, kann man aber sagen, dass er sich irgendwo zwischen der Geburt und dem Beobachtungszeitpunkt befinden muss, also links vom Beobachtungszeitpunkt.

Eine Beobachtung kann ebenfalls linkszensiert sein, wenn ein Verfahren eine bestimmte Nachweisgrenze hat. Das heißt, ein bestimmter Wirkstoff wird nur dann nachgewiesen, wenn seine Konzentration über der Nachweisgrenze liegt. Wird er nicht nachgewiesen, bedeutet das nicht, dass er nicht vorhanden ist. Vielmehr bedeutet es, dass die Konzentration zwischen Null und der Nachweisgrenze liegt und damit links der Nachweisgrenze. Er ist damit ebenfalls linkzensiert.

Rechtszensierte Daten

Ähnlich verhält es sich, wenn beispielsweise nur bekannt ist, dass eine Substanz nachgewiesen wurde, aber ihre genaue Konzentration nicht bekannt ist. Dann ist nur bekannt, dass die unbekannte Konzentration irgendwo rechts von der Nachweisgrenze liegt, sie also rechtszensiert ist.

Rechtszensierung kommt so häufig vor, dass sie weiter in Typ I und Typ II unterteilt wird. Eine Rechtszensierung vom Typ I tritt auf, wenn eine Studie zu einem bestimmten Zeitpunkt abgebrochen wird, auch wenn noch nicht alle Patienten bis zum interessierenden Ereignis beobachtet worden sind. In diesem Fall ist der Zensurzeitpunkt fest, und die Anzahl der Ereignisse ist eine Zufallsvariable. Bei der Typ-II-Zensierung würde die Studie fortgesetzt werden, bis eine bestimmte Anzahl von Ereignissen beobachtet werden ist. Beispielsweise könnte eine Studie gestoppt werden, nachdem genau 100 Patienten Antikörper entwickelt haben. In diesem Fall ist die Anzahl der Ereignisse fest, und die Zensurzeit die Zufallsvariable.

In den meisten klinischen Studien kann es passieren, dass Patienten aus Gründen zensiert werden, die sich außerhalb der Kontrolle des Prüfers befinden. Beispielsweise können einige Patienten zensiert werden, weil sie zu einem Nacherhebungszeitpunkt ihren Fragebogen nicht beantwortet haben, während andere zensiert werden, weil die Studie abgebrochen wurde. Diese Zensierung wird als zufällige Zensierung bezeichnet.

Intervallzensierte Daten

Neben Links- und Rechtszensierung existiert auch Intervallzensierung, bei der nur bekannt ist, dass eine Beobachtung in ein bestimmtes Intervall fällt. Wenn z. B. Probanden auf die Entwicklung von Antikörpern hin beobachtet werden und bei den ersten Erhebung keine Antikörper aufweisen, bei einer späteren Erhebung aber schon, dann ist nur bekannt, dass sich die Antikörper irgendwann zwischen der letzten und der aktuellen Messung und entwickelt haben müssen.

Literaturverzeichnis

  1. Rosen, K., Prasad, V., & Chen, E. Y. (2020). Censored patients in Kaplan-Meier plots of cancer drugs: An empirical analysis of data sharing. European Journal of Cancer (Oxford, England), 141, 152–161. doi:10.1016/j.ejca.2020.09.031