Veel voorkomende valkuilen bij statistische analyse: Intention-to-treat versus per-protocol analyse

INLEIDING

In interventionele studies houdt een subset van deelnemers zich vaak niet aan het protocol. Deze “protocolovertredingen” kunnen van verschillende aard zijn: Een of meer deelnemers krijgen om de een of andere reden niet de respectievelijke interventies waarnaar zij zijn gerandomiseerd, krijgen onbedoeld een interventie die bedoeld is voor de andere proefarm, krijgen een verboden bijkomende interventie, of zijn niet beschikbaar voor de beoordeling van de geplande uitkomst, hetzij door loss to follow-up, hetzij om een andere reden. Tijdens de analyse van de resultaten van de proef komt de onderzoeker in de verleiding om dergelijke “niet-conforme” deelnemers uit te sluiten. Het gaat hier niet om bedrog, maar om integriteit, om ervoor te zorgen dat er vergelijkingen worden gemaakt tussen de deelnemers in elke proefarm die zich strikt aan de geplande behandeling hebben gehouden, zodat de werkelijke doeltreffendheid van de ene interventie ten opzichte van de andere kan worden beoordeeld.

Hoewel deze aanpak, ondanks de hierboven beschreven schijnbare aantrekkelijkheid ervan, meerdere problemen oplevert. Deze problemen zijn onder meer:

Het is in strijd met het principe van randomisatie. In een 2-armige studie zorgt randomisatie voor vergelijkbaarheid van de twee groepen, d.w.z. evenwichtig voor bekende en onbekende confounders of prognostische factoren, alleen zoals ze oorspronkelijk waren gerandomiseerd. Wanneer sommige deelnemers in een van beide of beide groepen worden uitgesloten, kunnen de resterende deelnemers in de twee groepen niet langer als evenwichtig worden beschouwd. Het probleem wordt groter naarmate het aantal uitsluitingen toeneemt
Ten dele houdt de niet-naleving verband met een bepaalde interventie of met de ernst van de ziekte. Het onvermogen om de geplande behandeling te voltooien of het optreden van onaanvaardbare bijwerkingen kan bijvoorbeeld vaker voorkomen bij patiënten met een ernstige ziekte. Bovendien kunnen deze vaker voorkomen in de actieve-behandelingsarm dan in de placebo-arm. Daarom zou uitsluiting van de deelnemers die de behandeling of de follow-up niet volgens plan voltooien, leiden tot differentiële uitsluiting van patiënten met ernstige ziekte in de behandelde groep, waarbij het onwaarschijnlijk is dat de overblijvende groep lijkt op de oorspronkelijke groep die bij de randomisatie werd verkregen. Hierdoor kan de behandeling beter lijken dan deze in werkelijkheid is
Uitsluiting van deelnemers in een of beide groepen, vooral als hun aantal groot is, kan leiden tot een aanzienlijke vermindering van de steekproefgrootte en dus van de studiekracht
Uitsluitingen kunnen een vertekening veroorzaken. Vaak wordt het besluit om een bepaalde deelnemer uit te sluiten, althans tot op zekere hoogte, genomen door de onderzoeker, die in de verleiding kan komen om patiënten uit te sluiten die het in een bepaalde arm niet goed doen
Het doel van een proef is na te gaan welk percentage personen in een groep naar verwachting baat zal hebben bij een bepaalde behandeling. Van degenen die de behandeling niet afmaken, kan uiteraard niet worden verwacht dat zij er baat bij hebben. Het percentage patiënten dat de behandeling voltooit, geeft dus een overdreven schatting van het effect van de behandeling – dit weerspiegelt niet nauwkeurig het gunstige effect dat in de klinische praktijk mag worden verwacht van degenen die deze specifieke behandeling krijgen voorgeschreven.

Om deze problemen te voorkomen (of te minimaliseren), wordt aanbevolen een “intention-to-treat (ITT)-analyse” te gebruiken. Het principe van ITT-analyse is dat alle deelnemers moeten worden geanalyseerd in de groep waarin zij zijn gerandomiseerd, d.w.z. alsof zij de interventie hebben gekregen die zij verondersteld werden te krijgen, ongeacht de behandeling die zij daadwerkelijk hebben gekregen. Fisher definieert ITT als een analyse die “alle gerandomiseerde patiënten omvat in de groepen waaraan zij willekeurig zijn toegewezen, ongeacht hun naleving van de toelatingscriteria, ongeacht de behandeling die zij feitelijk hebben gekregen, en ongeacht latere terugtrekking uit de behandeling of afwijking van het protocol.”

Het gebruik van ITT-analyse zorgt voor behoud van de vergelijkbaarheid tussen groepen zoals verkregen door randomisatie, voor behoud van de steekproefgrootte en voorkoming van bias. Bovendien sluiten de resultaten van een dergelijke analyse beter aan bij de klinische praktijk, omdat het gaat om de “effectiviteit” van de interventie en niet om de “werkzaamheid”. Gezien deze voordelen wordt ITT tegenwoordig beschouwd als de defacto standaard voor de analyse van klinische trials, hoewel een minderheidsgroep van mening is dat deze aanpak te conservatief is.

Bij een per-protocol (PP) analyse daarentegen worden alleen die patiënten in de analyse opgenomen die zich strikt aan het protocol hebben gehouden. De PP-analyse geeft een schatting van de werkelijke doeltreffendheid van een interventie, d.w.z. bij degenen die de behandeling volgens plan hebben voltooid. Zoals hierboven besproken, zijn de resultaten echter niet representatief voor de werkelijke situatie en is de kans groot dat zij een overdreven behandelingseffect laten zien.

De CONSORT-richtlijnen voor de rapportage van “parallel group randomized controlled trials” bevelen aan dat zowel ITT- als PP-analyses worden gerapporteerd voor alle geplande uitkomsten, zodat lezers het effect van een interventie kunnen interpreteren.

Natuurlijk zijn er enkele bijzondere situaties. Zo wordt bij noninferioriteitstrials het gebruik van PP-analyses bijzonder belangrijk geacht. Een gedetailleerde bespreking hiervan valt buiten het bestek van dit stuk, maar zal worden gedaan in een volgend artikel in deze serie.

Een gerandomiseerde trial die onlangs werd gepubliceerd in de New England Journal of Medicine vergeleek vroege (interventie-arm) versus uitgestelde (standaard-arm) introductie van allergene voedingsmiddelen in het dieet van kinderen die borstvoeding kregen. Het primaire resultaat was de ontwikkeling van allergie voor enig voedingsmiddel tussen de leeftijd van 1 en 3 jaar. De resultaten van de ITT-analyse (1162 deelnemers) toonden geen verschil tussen de groepen voor het primaire resultaat (interventie-arm: 32/567 versus standaard-arm: 42/595 ; P = ns). Een PP-analyse (732 deelnemers) toonde echter een significant lagere frequentie van voedselallergie in de interventie-arm versus de standaard-arm (5/208 vs. 38/524 ; P = 0,01). Het is interessant op te merken dat slechts 32% (208/652) van de deelnemers in de interventie-arm zich aan het protocol hielden, vergeleken met 88% (524/595) van de deelnemers in de standaard-arm. The authors have offered several explanations for this lack of compliance. Importantly, and in our opinion rightly, they gave precedence to the results of the ITT analysis over those of the PP analysis, and concluded that “the trial did not show the efficacy of early introduction of allergenic foods.”

Financial support and sponsorship

Nil.

Conflicts of interest

There are no conflicts of interest.

PMC

INLEIDING

Financial support and sponsorship

Conflicts of interest

Geef een antwoord Antwoord annuleren