Viktiga begrepp inom klinisk prövningsanalys för allmänheten att förstå 
 ‘Texas-skytten’

Viktiga begrepp inom klinisk prövningsanalys för allmänheten att förstå ‘Texas-skytten’

Can we help?

Dr. Stephen Evans, en ledande expert inom klinisk prövningsmetodik och epidemiologi, förklarar viktiga statistiska begrepp på ett lättförståeligt sätt för patienter. Han beskriver vad en underdimensionerad studie innebär och varför sådana studier ofta misslyckas med att upptäcka verkliga behandlingseffekter. Dr. Evans betonar också vikten av att förutbestämma primära slutpunkter för att undvika partiskhet. Dessutom förtydligar han måttet "Number Needed to Treat" (NNT) och belyser dess användningsområden samt begränsningar. Dessa begrepp är avgörande för att kunna tolka medicinska nyheter och förstå behandlingseffekter.

More from All

Förstå klinisk prövningsanalys: Styrka, slutpunkter och NNT förklarade

Hoppa till avsnitt

Underdimensionerade kliniska prövningar

En underdimensionerad klinisk prövning har för få deltagare för att på ett tillförlitligt sätt kunna upptäcka en verklig behandlingseffekt. Dr. Stephen Evans, MD, förklarar att en prövnings styrka avser dess förmåga att upptäcka en sann skillnad om den finns. Han tar COVID-19-behandlingsprövningar som exempel och påpekar att studier av dödlighet kräver stora urval eftersom dödstal ofta är låga.

Att exempelvis upptäcka en minskning av dödlighet från 10 % till 7 % kräver ett stort antal patienter. Om en prövning är för liten blir den underdimensionerad och riskerar att missa en kliniskt viktig effekt. Många tidiga COVID-19-prövningar var underdimensionerade för dödlighetsutfall. Dr. Stephen Evans, MD, betonar att styrkan är direkt relaterad till det specifika utfall som studeras.

Primära vs sekundära slutpunkter

Kliniska prövningar definierar primära och sekundära slutpunkter för att mäta behandlingsframgång. Den primära slutpunkten är det huvudsakliga utfall som prövningen är utformad för att utvärdera. Dr. Stephen Evans, MD, påpekar att dödlighet är en kritisk men utmanande primär slutpunkt eftersom den kräver stora patientgrupper.

Forskare väljer ofta lättare att studera primära utfall, som tid till återhämtning eller viral belastning. Dessa objektiva mått kan kräva färre deltagare. Dr. Evans varnar dock för att dessa definitioner måste vara tydliga och fastställda innan prövningen inleds. Att ändra slutpunkter efter att ha sett resultaten introducerar betydande bias och ogiltigförklarar fynden.

Texas Sharpshooter-felslut

Texas Sharpshooter-felslutet är ett kritiskt koncept för integriteten i kliniska prövningar. Dr. Stephen Evans, MD, beskriver det som att rita ett mål runt kulhål efter att ha skjutit. Inom forskning innebär detta att ändra prövningens primära utfall efter att ha sett data för att få ett önskat resultat.

Denna praxis introducerar allvarlig bias och underminerar prövningens validitet. Även om det finns legitima skäl att ändra slutpunkter måste detta ske före insyn i resultaten. Dr. Evans betonar att förspecifikation av slutpunkter är avgörande för trovärdig klinisk prövningsanalys. Detta förhindrar att forskare manipulerar utfall för att visa falskt positiva resultat.

Number Needed to Treat (NNT)

Number Needed to Treat (NNT) är ett användbart mått för patienter att förstå behandlingsnytta. Dr. Stephen Evans, MD, definierar NNT som antalet patienter som behöver behandlas för att förhindra ett dåligt utfall. Om ett läkemedel till exempel reducerar dödlighet från 10 % till 5 % blir NNT 20.

Detta innebär att 20 personer måste behandlas för att förhindra en död. Dr. Stephen Evans, MD, påpekar dock viktiga begränsningar: NNT är inte ett absolut tal utan beror på uppföljningstid och utfallsdefinition. Jämförelser mellan behandlingar är endast giltiga om NNT beräknas identiskt. Trots sin enkelhet kräver NNT noggrann tolkning.

Tolkning av prövningsresultat

Korrekt tolkning av kliniska prövningsresultat kräver förståelse för viktiga statistiska koncept. Dr. Stephen Evans, MD, rekommenderar att leta efter adekvat kraftfulla studier med förspecificerade slutpunkter. Detta säkerställer att fynden är tillförlitliga och inte beroende av slump eller bias.

Patienter bör överväga den kliniska relevansen av utfallen. Ett statistiskt signifikant resultat kanske inte är meningsfullt om NNT är mycket högt. Dr. Anton Titov, MD, framhäver vikten av dessa koncept för folkhälsokunskap. Att förstå styrka, slutpunkter och NNT hjälper alla att kritiskt utvärdera medicinska nyheter och fatta informerade beslut.

Fullständig transkription

Dr. Anton Titov, MD: Professor Evans, det finns flera grundläggande koncept i kliniska prövningar. Vad betyder det till exempel att en prövning är underdimensionerad? Klinisk prövningsterminologi är nu i förgrunden; den finns i tidningarna. Människor måste förstå dessa grundläggande koncept. Så vad betyder det om en prövning är underdimensionerad? Vad är NNT, number needed to treat? Det finns för- och nackdelar och den typen av grundkoncept. Vilka är de primära och sekundära slutpunkterna för kliniska prövningar? Klart är att några prövningar har flyttat målstolpar, och detta har varit vanliga data i det medicinska samhället.

Dr. Stephen Evans, MD: Vi kommer att försöka ta nästan alla våra exempel från den nuvarande situationen med COVID-19. Om vi ska studera dödlighet kommer det att kräva ett ganska stort antal människor. Som tur är kommer inte alla att dö, även i en sjukhusituation. Om vi har, låt oss säga, 10 % av människor som dör, då för att hitta en skillnad som troligen skulle vara ganska viktig—säg, att reducera den 10 % dödligheten inom 30 dagar från behandlingsstart ned till 7 % dödlighet—vi går från 10 % ned till 7 %. Vi kommer att behöva ett stort antal patienter för att kunna ta reda på om en sådan skillnad faktiskt inträffar.

Vi gör statistisk analys på det. Men om siffrorna är för små i prövningen, då är det en prövning vi kallar underdimensionerad. Studiens styrka att upptäcka en verklig skillnad, om den existerar, var för låg. Detta var sant för några av de tidiga prövningarna som genomfördes på potentiella behandlingar för COVID-19.

Medan om vi studerar tusentals patienter, då är det osannolikt att prövningen kommer att vara underdimensionerad för dödlighet som utfall, förutsatt att vi hanterar skillnader som är rimliga. Om vi ville upptäcka en skillnad mellan en 10 % dödlighet och en 9,9 % dödlighet, skulle vi behöva tiotusentals patienter. Det är naturligtvis inte en skillnad som skulle vara särskilt användbar för enskilda patienter.

Så underdimensionerade prövningar är ett problem. Det är underdimensionerat i relation till det utfall du studerar. Om du gjorde dödlighet till ditt primära utfall skulle du behöva många patienter. Mycket ofta gör folk dödlighet till ett sekundärt utfall och gör sitt primära utfall något som är lättare att studera och för vilket vi behöver färre patienter.

I denna typ av situation är det ofta tiden till återhämtning från sjukdomen. Problemet med det är att det kan vara något subjektivt. Du kan definiera att någon når en nivå av återhämtning baserat på en klinisk bedömning, men det kan baseras på viral belastning eller något sådant, vilket är en objektiv bedömning.

Så vi kan kanske ha en objektiv bedömning för ett primärt utfall som är lättare att studera än dödlighet. Problemet är att när vi tittar på återhämtning har vi en definition för det. Men det kan vara så att människor inte uppfyller dessa definitioner. Det blir uppenbart i prövningen att det utfall du satte som primärt inte kommer att ge dig några användbara data.

Det kan finnas legitima skäl för att ändra det. Men svårigheten är att om människor vet vad resultaten visar kan de ändra frågan och därmed få det svar de vill ha. Inom epidemiologi kallas detta Texas sharpshooter-syndromet, där den texanske skyttens står vid sidan av en lada och skjuter sin pistol mot ladan, och sedan efteråt går fram och ritar ett mål.

Du behöver i en prövning ha ett mål specificerat i förväg, sedan göra prövningen och se vad resultaten är, snarare än att ändra målet medan prövningen pågår. I allmänhet kan det finnas legitima skäl för att ändra ditt utfall. Men du måste vara mycket försiktig och se till att du inte gör det efter att redan ha skjutit din pistol och sett var kulorna faller.

Du måste göra det innan du vet var kulorna faller.

När vi kommer till att mäta utfallet är en av de saker vi kan göra att säga, vad är dödligheten? Låt oss säga att vi har en behandlingsskillnad från 10 % ned till 5 %. Det betyder att på varje hundra personer kommer det att finnas fem personer som inte dör som ett resultat av att ha fått behandling. För varje 20 personer kommer det att finnas en person som inte dör.

När vi vänder på det säger vi att antalet som behöver behandlas för att förhindra en död kommer att vara 20, med vår skillnad mellan 10 % och 5 %. Det skulle också vara fallet om det fanns en skillnad mellan 20 % och 15 % eller mellan 50 % och 45 %. Det är ett mått på antalet patienter som behöver behandlas för att förhindra en död.

Ibland, istället för död, tittar vi på en specifik händelse som hjärtinfarkt eller stroke. Problemet med detta nummer är att det inte är ett rent tal. Det beror på hur länge du har följt upp patienter. Det har också några andra statistiska problem med sig.

Så det är inte ett som jag särskilt gillar, även om det låter som en ganska trevlig sak att säga: "Åh, detta läkemedel kräver 20 patienter som behöver behandlas för att få nyttan, medan detta läkemedel kräver 50 patienter som behöver behandlas." Om du har använt samma regler för båda, då kan NNT vara ganska hjälpsamt. Men du måste vara försiktig så att du ser till att din definition av NNT, som inte är ett rent tal, används exakt samma när du gör jämförelser mellan behandlingar.