INTRODUCTION
In Interventionsstudien hält sich eine Teilmenge der Teilnehmer oft nicht an das Protokoll. Diese „Protokollverstöße“ können unterschiedlicher Art sein: Ein oder mehrere Teilnehmer erhalten aus irgendeinem Grund nicht die jeweiligen Interventionen, auf die sie randomisiert wurden, sie erhalten versehentlich eine Intervention, die für den anderen Studienarm bestimmt ist, sie erhalten eine verbotene begleitende Intervention oder sie stehen für die Bewertung des geplanten Ergebnisses nicht zur Verfügung, sei es wegen „loss to follow-up“ oder aus einem anderen Grund. Bei der Analyse der Studienergebnisse ist der Forscher versucht, solche „nicht konformen“ Teilnehmer auszuschließen. Dabei geht es nicht um Täuschung, sondern um Integrität, um sicherzustellen, dass Vergleiche zwischen den Teilnehmern in jedem Studienarm angestellt werden, die sich strikt an die geplante Behandlung gehalten haben, so dass die tatsächliche Wirksamkeit der einen Intervention gegenüber der anderen bewertet werden kann.
Doch trotz der oben genannten scheinbaren Attraktivität dieses Ansatzes wirft ein solcher Ausschluss mehrere Probleme auf. Dazu gehören:
-
Sie verstößt gegen das Prinzip der Randomisierung. In einer zweiarmigen Studie gewährleistet die Randomisierung die Vergleichbarkeit der beiden Gruppen, d. h. die Ausgewogenheit in Bezug auf bekannte und unbekannte Störfaktoren oder prognostische Faktoren, nur so, wie sie ursprünglich randomisiert wurden. Wenn einige Teilnehmer in einer oder beiden Gruppen ausgeschlossen werden, können die verbleibenden Teilnehmer in den beiden Gruppen nicht mehr als ausgewogen angesehen werden. Das Problem wird umso größer, je mehr Teilnehmer ausgeschlossen werden
-
Zuweilen hängt die Nichteinhaltung mit einer bestimmten Maßnahme oder dem Schweregrad der Erkrankung zusammen. So kann beispielsweise die Unfähigkeit, die geplante Behandlung zu Ende zu führen, oder das Auftreten inakzeptabler Nebenwirkungen bei Patienten mit schwerer Krankheit häufiger auftreten. Darüber hinaus können diese Probleme in der aktiven Behandlungsgruppe häufiger auftreten als in der Placebo-Gruppe. Daher würde der Ausschluss von Teilnehmern, die die Behandlung oder die Nachbeobachtung nicht wie geplant abschließen, zu einem differenzierten Ausschluss von Patienten mit schwerer Erkrankung in der behandelten Gruppe führen, wobei die verbleibende Gruppe wahrscheinlich nicht der ursprünglichen Gruppe bei der Randomisierung ähneln wird. Dies kann die Behandlung besser aussehen lassen, als sie tatsächlich ist
-
Der Ausschluss von Teilnehmern in einer oder beiden Gruppen, insbesondere wenn ihre Zahl groß ist, kann zu einer erheblichen Verringerung des Stichprobenumfangs und damit der Aussagekraft der Studie führen
-
Ausschlüsse können eine Verzerrung verursachen. Oft wird die Entscheidung, einen bestimmten Teilnehmer auszuschließen, zumindest bis zu einem gewissen Grad vom Prüfer kontrolliert, der versucht sein könnte, Patienten auszuschließen, die in einem bestimmten Arm nicht gut abschneiden
-
Der Zweck einer Studie besteht darin, den Anteil der Personen in einer Gruppe zu ermitteln, von denen erwartet werden kann, dass sie von einer bestimmten Behandlung profitieren. Von denjenigen, die die Behandlung nicht abschließen, kann natürlich nicht erwartet werden, dass sie von ihr profitieren. Der Anteil der Responder unter denjenigen, die die Behandlung abschließen, liefert daher eine übertriebene Schätzung des Behandlungseffekts – dies spiegelt nicht genau die positive Wirkung wider, die in der klinischen Praxis bei denjenigen zu erwarten ist, denen diese bestimmte Behandlung verschrieben wird.
Um diese Probleme zu vermeiden (oder zu minimieren), wird empfohlen, eine „Intention-to-treat (ITT)-Analyse“ durchzuführen. Das Prinzip der ITT-Analyse besteht darin, dass alle Teilnehmer in der Gruppe analysiert werden, in die sie randomisiert wurden, d.h. so, als ob sie die Intervention erhalten hätten, die sie erhalten sollten, unabhängig von der tatsächlich erhaltenen Behandlung. Fisher definiert ITT als eine Analyse, die „alle randomisierten Patienten in die Gruppen einschließt, denen sie nach dem Zufallsprinzip zugewiesen wurden, unabhängig davon, ob sie die Teilnahmekriterien erfüllt haben, unabhängig von der Behandlung, die sie tatsächlich erhalten haben, und unabhängig von einem späteren Abbruch der Behandlung oder einer Abweichung vom Protokoll.“
Die Verwendung der ITT-Analyse gewährleistet die Vergleichbarkeit zwischen den Gruppen, wie sie durch die Randomisierung erreicht wurde, erhält die Stichprobengröße aufrecht und beseitigt Verzerrungen. Darüber hinaus entsprechen die Ergebnisse einer solchen Analyse eher der klinischen Praxis, da es sich um die „Wirksamkeit“ der Intervention und nicht um die „Effizienz“ handelt. Angesichts dieser Vorteile gilt die ITT-Analyse heute als Defacto-Standard für die Analyse klinischer Studien, auch wenn eine Minderheitsmeinung diesen Ansatz für zu konservativ hält.
Im Gegensatz dazu werden bei der Per-Protocol-Analyse (PP) nur diejenigen Patienten in die Analyse einbezogen, die sich strikt an das Protokoll gehalten haben. Die PP-Analyse liefert eine Schätzung der tatsächlichen Wirksamkeit einer Intervention, d.h. unter denjenigen, die die Behandlung wie geplant durchgeführt haben. Die CONSORT-Richtlinien für die Berichterstattung über „randomisierte kontrollierte Studien mit parallelen Gruppen“ empfehlen, dass sowohl ITT- als auch PP-Analysen für alle geplanten Ergebnisse berichtet werden sollten, damit die Leser die Wirkung einer Intervention interpretieren können.
Natürlich gibt es einige besondere Situationen. Zum Beispiel wird bei Nichtunterlegenheitsstudien die Verwendung der PP-Analyse als besonders wichtig angesehen. Eine ausführliche Diskussion darüber würde den Rahmen dieses Beitrags sprengen, wird aber in einem späteren Artikel dieser Reihe erfolgen.
Eine kürzlich im New England Journal of Medicine veröffentlichte randomisierte Studie verglich die frühe (Interventionsarm) mit der verzögerten (Standardarm) Einführung allergener Nahrungsmittel in die Ernährung gestillter Kinder. Das primäre Ergebnis war die Entwicklung einer Allergie gegen ein Lebensmittel im Alter von 1 bis 3 Jahren. Die Ergebnisse der ITT-Analyse (1162 Teilnehmerinnen) zeigten keinen Unterschied zwischen den Gruppen in Bezug auf den primären Endpunkt (Interventionsarm: 32/567 gegenüber Standardarm: 42/595; P = ns). Eine PP-Analyse (732 Teilnehmer) zeigte jedoch eine signifikant geringere Häufigkeit von Nahrungsmittelallergien in der Interventionsgruppe gegenüber der Standardgruppe (5/208 vs. 38/524 ; P = 0,01). Interessant ist, dass sich nur 32 % (208/652) der Teilnehmer in der Interventionsgruppe an das Protokoll hielten, während es in der Standardgruppe 88 % (524/595) der Teilnehmer waren. The authors have offered several explanations for this lack of compliance. Importantly, and in our opinion rightly, they gave precedence to the results of the ITT analysis over those of the PP analysis, and concluded that „the trial did not show the efficacy of early introduction of allergenic foods.“
Financial support and sponsorship
Nil.
Conflicts of interest
There are no conflicts of interest.