Lexikon

Sensitivität und Spezifität

Sensitivität und Spezifität sind statistische Maße für die Durchführung eines binären Klassifikationstests.

  • Sensitivität misst den Anteil der tatsächlichen Positiven, die korrekt als solche erkannt werden (z.B. den Prozentsatz der Kranken, die korrekt als solche erkannt werden).
  • Spezifität misst den Anteil der tatsächlichen Negativen, die korrekt als solche identifiziert werden (z.B. den Anteil der gesunden Menschen, die korrekt als nicht krank erkannt werden).

Sensitivität

Die Sensitivität eines klinischen Tests bezieht sich auf die Fähigkeit des Tests, die Patienten mit einer Krankheit korrekt zu identifizieren. Ein Test mit 100%-iger Sensitivität identifiziert alle Patienten mit der Krankheit korrekt. Ein Test mit 80% Sensitivität erkennt 80% der Patienten mit der Krankheit (richtig-positiv), aber 20% mit der Krankheit bleiben unentdeckt (falsch-negativ). Eine hohe Sensitivität ist besonders wichtig, wenn der Test zur Erkennung einer schweren, aber behandelbaren Erkrankung (z.B. Gebärmutterhalskrebs) eingesetzt wird. Das Screening der weiblichen Population durch einen Abstrich ist ein sensitiver Test. Es ist jedoch nicht sehr spezifisch und ein hoher Anteil von Frauen mit einem positiven Gebärmutterhalsabstrich, die eine Kolposkopie machen, hat letztlich keine zugrundeliegende Erkrankung.

Spezifität

Die Spezifität eines klinischen Tests bezieht sich auf die Fähigkeit des Tests, die Patienten ohne die Krankheit korrekt zu identifizieren. Ein Test mit 100%-iger Spezifität identifiziert daher alle Patienten ohne Erkrankung korrekt. Ein Test mit 80% Spezifität identifiziert 80% der Patienten ohne Krankheit als Testnegativ (richtig-negativ), aber 20% der Patienten ohne Krankheit werden fälschlicherweise als Testpositiv (falsch-positiv) identifiziert.

Wie oben beschrieben, führt ein Test mit hoher Sensitivität, aber geringer Spezifität dazu, dass viele Patienten, die krankheitsfrei sind, von der Möglichkeit in Kenntnis gesetzt werden, dass sie die Krankheit haben und dann einer weiteren Untersuchung unterzogen werden. Obwohl die ideale (aber unrealistische) Situation ein 100% genauer Test wäre, ist eine gute Alternative, Patienten, die zuerst von einem Test mit hoher Sensitivität / niedriger Spezifität als positiv identifiziert wurden, einem zweiten Test mit niedriger Sensitivität / hoher Spezifität zu unterwerfen.

Für jeden Test gibt es in der Regel einen Kompromiss zwischen beiden Werten – zum Beispiel bei der Flughafensicherheit, da die Prüfung der Passagiere auf potenzielle Gefahren für die Sicherheit ausgerichtet ist, können Scanner so eingestellt werden, dass sie bei risikoarmen Gegenständen wie Gürtelschnallen und Schlüsseln Alarm auslösen (geringe Spezifität), um die Wahrscheinlichkeit zu erhöhen, gefährliche Objekte zu identifizieren und das Risiko von fehlenden Objekten, die eine Bedrohung darstellen, zu minimieren (hohe Empfindlichkeit). Dieser Kompromiss kann mit Hilfe einer Receiver-Operating-Characteristic-Kurve grafisch dargestellt werden. Ein perfekter Prädiktor würde als 100% sensitiv beschrieben werden, was bedeutet, dass alle kranken Personen korrekt als krank identifiziert werden, und 100% spezifisch, was bedeutet, dass keine gesunden Personen falsch als krank identifiziert werden. In Wirklichkeit jedoch wird jeder nicht-deterministische Prädiktor eine minimale Fehlergrenze besitzen, die als Bayes-Fehlerrate bekannt ist.