Kommentar till inlämningsuppgiften vid EBM-dagen

Kommentar till inlämningsuppgiften vid EBM-dagen, termin 5
Uppgiften
Du är ST-läkare på medicinkliniken i Eskilstälje och har fått i uppgift att uppdatera klinikens behandlingsrutiner för diabetes mellitus typ-2. Du har kommit till det icke-farmakologiska omhändertagandet – närmare bestämt kostråd – och kontaktar därför den dietist som är knuten till kliniken. Tillsammans konstaterar ni att kostråden hittills i stort sett följer rekommendationerna från European
Associationen for the Study of Diabetes (EASD), nämligen lågt fettintag (mindre än 35% av totala
energiintaget [35 E%], mindre än 30 E% om patienten är överviktig och behöver gå ned i vikt), högt
kolhydratintag (45-60 E%, gärna mycket fibrer och lågt glykemiskt index - GI) och ett proteinintag på
10-20 E%. Ni konstaterar också att en stor del av era patienter med typ-2 diabetes är överviktiga eller
obesa.
Dietisten säger att det finns gamla rapporter som gett hållpunkter för att ett högt kolhydratintag kan
förvärra diabetespatienters hyperglykemi och minska halterna av det ”goda” HDL-kolesterolet. Hon
säger också att dieter med extremt lågt kolhydratintag, som Atkinsdieten med ett initialt kolhydratintag på 4-5 E% och ett fettintag på cirka 70 E%, har visat goda resultat vad gäller viktnedgång och
blodfetter hos överviktiga friska personer. Därtill visar hon två intressanta artiklar baserade på randomiserade studier från 2005 och 2006, som båda tyder på att en låg-kolhydratdiet åtminstone på kort
sikt kan ge bättre viktnedgång, bättre glycemisk kontroll och en mer gynnsam lipoproteinprofil än en
traditionell låg-fettdiet1. Så varför inte överväga att gå över till att rekommendera en låg-kolhydratdiet till typ-2 diabetes-patienterna, åtminstone de med övervikt/obesitas? En strikt Atkins-diet
kanske är att ta i. Men ett kolhydratintag på under 40 E% kanske skulle räcka. Med ett proteinintag
på 20 E% innebär den dieten ett fettintag på 40 E%. Du lovar att undersöka det aktuella
kunskapsläget .
Då du är en van utövare av evidensbaserad medicin börjar du med att leta efter en systematisk
översikt, och eftersom du vet att översikterna på Cochrane Library i princip alltid är systematiska och
för det mesta välgjorda så börjar du med att söka där. Du skriver ”type-2 diabetes diet” i sökrutan
och får upp 21 Cochrane Reviews, och redan som nummer 2 finns den mest relevanta: Nield L, More
H, Hooper L, et al. Dietary advice for treatment of type 2 diabetes mellitus in adults. I träfflistan står
årtalet 2009, vilket ju låter ganska aktuellt. När du laddar ner pdf:en kan du läsa följande under
rubriken ”Studies that assessed low-fat diets versus moderate fat or low-carbohydrate diets”:
” ..five out of ….six trials were assessed to be at a high risk of bias…” och “…no firm conclusions could be
drawn…”
Och under Authors’ conclusions:
“There are no high quality data on the efficacy of the dietary treatment of type 2 diabetes…” och “There is an
urgent need for well-designed studies which examine a range of interventions, at various points during followup, although there is a promising study currently underway.“
När du tittar på första textsidan (med abstractet) ser du att översikten ska refereras som Cochrane
Database Syst Rev. 2007;(3):CD004097 (alltså inte 2009), och när du tittar ännu närmare ser du
följande deklaration:
Review content assessed as up-to-date: 30 October 2006.
1
Översikten är alltså fem år gammal, och ingen av de studier som dietisten visade fanns citerad.
Redan när översikten skrevs antyddes att nya data var på väg. Därför bestämmer du dig att gå vidare
med en sökning på PubMed.
För att underlätta läsningen av artiklar inom detta område, där intaget av kolhydrater, protein och fett omväxlande anges som energiprocent (E%) och omväxlande som gram per dag, påminns du om att energiinnehållet i kolhydrater och protein är cirka 4 kcal/gram, medan det i fett är cirka 9 kcal/gram. Tabellen
nedan visar exempel på transformationen mellan E% och intag per dag:
Vid 2000 kcal/dag
Vid 1500 kcal/dag
4 E%
10 E%
30 E%
40 E%
4 E%
10 E%
30 E%
40 E%
Kolhydrat
20 g/dag
50 g/dag
150 g/dag
200 g/dag
15 g/dag
38 g/dag
113 g/dag
150 g/dag
Fett
9 g/dag
22 g/dag
67 g/dag
89 g/dag
7 g/dag
17 g/dag
50 g/dag
67 g/dag
Protein
20 g/dag
50 g/dag
150 g/dag
200 g/dag
15 g/dag
38 g/dag
113 g/dag
150 g/dag
________________
Pohl M, Mayr P, Metl-Roetzer, et al. Glycaemic control in type II diabetic tube-fed patients with a new
enteral formula low in carbohydrates and high in monounsaturated fatty acids: a randomized controlled
trial. Eur J Clin Nutr 2005;59:1221-32.: Bland 78 typ-2 diabetes-patienter med behov av sondmatning hade de
39 som under 12 veckor matades med en näringslösning med 37 E% kolhydrater och 45 E% fett ett signifikant
lägre insulinbehov, blodglykos och HbA1C jämfört med de 39 som fick en näringslösning med samma
energiinnehåll men bestående av 52 E% kolhydrater och 30 E% fett.
Daly ME, Paisey R, Paisey R, et al. Short-term effects of severe dietary carbohydrate-restriction advice in Type
2 diabetes – a randomized controlled trial. Diabet Med 2006;23:15-20.: En RCT, där 102 obesa patienter med
dåligt kontrollerad typ-2 diabetes randomiserades till en låg-kolhydratdiet med max 70 gram kolhydrater per
dag (cirka 21 E% vid 1300 kcal) eller en lågfettdiet med samma energiinnehåll. Studien varade i 3 månader. I
praktiken nådde de som randomiserats till låg-kolhydratdiet i medeltal 34 E% kolhydrat och 40 E% fett, med de
som allokerats till lågfettdiet i medeltal intog 45 E% kolhydrat och 33 E% fett. Viktnedgången i låg-kolhydratgruppen var signifikant större än i låg-fettgruppen, och HDL ökade signifikant mer.
1)
2
Svarsblankett
Du måste börja med att skriva en PICO-fråga. Formulera den och motivera ditt val av
avgränsningar:
I EBM-sammanhang bör frågan vara så specifik som möjligt. Meningen är att svaret direkt ska kunna
appliceras på en väldefinierad patientgrupp. Man vill inte ha ett svar som svävar ut i långa utläggningar om hur det ligger till för olika undergrupper av sjukdomen i fråga, eller hur olika varianter av
den aktuella behandlingen fungerar. I de flesta fall finns det många olika tänkbara utfall – i det
aktuella fallet kan man tänka sig allt från det ”hårdaste” utfallet överlevnad, via incidens av hjärtinfarkt, incidens av kardiovaskulära sjukdomar eller stroke, och incidens av andra diabeteskomplikationer såsom retinopati, nefropati eller neuropati, till intermediära surrogatutfall som viktnedgång,
glykemisk kontroll, och blodfettmönster. Helst skulle man vilja ha en fråga som är så specificerad att
den kan besvaras med ett kortfattat ja eller nej. En sådan fråga bör därför ställas enligt den engelska
PICO-modellen (Population/patientkategori – Intervention [alltså den behandling eller exponering
som frågan gäller] – Control [vad som är jämförelsebetingelse – placebo? Annan specificerad
behandling?] – Outcome [utfall]). De som är vana vid att praktisera evidensbaserad medicin (EBM)
har alltid PICO i bakhuvudet. Försök även du att inkorporera PICO i din arsenal. En bra PICO-fråga kan
formuleras som följer:
Population/patientkategori
Intervention
Control
Outcome
Patienter med typ-2 diabetes
mellitus
Låg-kolhydratdiet
Låg-fettdiet
Glykemisk kontroll
Eller mer fritt:
Bland patienter med diabetes mellitus typ 2, leder låg-kolhydratdiet till en bättre glykemisk kontroll
än vad låg-fettdiet gör?
Men det finns många olika kategorier av patienter med diabetes mellitus typ 2, och det är inte väldefinierat vad som utgör en låg-kolhydratdiet eller en låg-fettdiet. Så man måste först fatta ett antal
beslut:
P: Patient/population: Definition av diabetes mellitus typ 2 är knappast kontroversiellt, men ska det
vara diabetes med samtidig övervikt? Ska det vara läkemedelsbehandlad eller bara kostbehandlad
diabetes? Skillnader mellan kostbehandlad och läkemedelsbehandlad diabetes kan påverka de
studerade sambanden. Vid svår läkemedelsbehandlad diabetes måste man kanske justera doserna
för att inte få hypoglykemi vid extrem låg-kolhydratkost, och det kan påverka utfallsmåtten. Likaså
finns det perorala antidiabetesmedel som har viktuppgång som biverkan, återigen med påverkan på
ett centralt utfallsmått. I vår övning bestämde vi oss för att acceptera såväl exklusivt kostbehandlad
som läkemedelsbehandlad (inklusive insulinbehandlad) diabetes. Men i ett annat sammanhang
kanske du hade valt att ha en annan definition.
I: Intervention: Vad ska betecknas som låg-kolhydratkost? Atkins-dieten är ju extrem och föreskriver
högst 20 gram kolhydrat per dag (motsvarar 4% av totala energiintaget [4 E%] vid 2000 kcal/dag)
under de 2 första veckorna – sedan får man vecka för vecka successivt öka kolhydratintaget med 5
gram per dag. I vår övning definierade vi låg-kolhydratdiet som en diet där ≤40 E% tillgodoses med
kolhydrater (motsvarar 200 gram kolhydrat per dag vid 2000 kcal/dag). Eftersom proteinintaget
3
brukar ligga runt eller strax under 20 E% blir då energiintaget i form av fett 40 E% (energin från
kolhydrater, fett och proteiner ska addera ihop till 100%1). Med den definitionen inkluderas också
den ursprungliga Atkinsdieten. Återigen är det du som ställer frågan som måste bestämma, så i ett
annat sammanhang kanske du hade bestämt dig för en annan definition. Ibland finner du, när du
gjort dina första preliminära sökningar, att det inte finns några studier som exakt motsvarar din
definition, men att det kanske finns studier som använt en något annorlunda definition. Då måste du
ta ställning till om du tror att resultat från studier som använt den definitionen kan överföras till den
situation som du ursprungligen ville få belyst. Detta kräver förstås medicinska grundkunskaper. Det
är därför som EBM aldrig kan ersätta din läkarutbildning.
C: Comparison: Det är sannolikt oetiskt att allokera diabetespatienter till att äta vad som helst utan
restriktioner. Alla får någon form av kostråd. Eftersom låg-fettdiet är det dominerande kostrådet som
idag ges till patienter med typ-2 diabetes så är det den naturliga jämförelsebetingelsen, men det
finns många varianter. Ett fettintag på 30 E% är ett vanligt behandlingsmål, men den i Sverige
förhärskande rekommendationen från European Association for the Study of Diabetes (EASD) sätter
gränsen vid 35 E% (30 E% om behov finns för viknedgång). Här handlar det ju om överviktiga
patienter, så 30 E% verkar vara en lämplig ledstjärna. Vid dessa låg-fettdieter hamnar kolhydratintaget på 50-55 E%. Kolhydraternas sammansättning kan varieras, men ofta rekommenderas fullkornsprodukter och produkter med lågt glykemiskt index (GI). Vid övningen bestämde vi att ha en
kost med ≤30 E% fett, 15-20 E% protein och 50-55 E% kolhydrat (med eller utan specificerat GIvärde) som jämförelsebetingelse. En fråga som uppstår är om jämförelsen ska vara isokalorisk (dvs.
om båda kosterna som jämförs i en studie ska ha samma energiinnehåll). Vid övningen krävde vi inte
att de jämförda dieterna skulle ha samma energiinnehåll, dels därför att kaloribehovet ofta bestäms
individuellt baserat på kroppsmått och grad av fysisk aktivitet, dels för att det, när ambitionen är att
uppnå isokaloriska förhållanden, i praktiken är väldigt svårt att erhålla en perfekt balansering mellan
behandlingsarmarna.
O: Outcome: Det finns ännu inga studier av tillräcklig storlek för att belysa hårda utfall som död,
kardiovaskulär sjuklighet eller andra allvarliga diabeteskomplikationer, så man får fortfarande nöja
sig med surrogatmått som glykemisk kontroll (förändring av HbA1C), viktnedgång, och förändring av
lipidstatus (triglycerider, HDL kolesterol, kvoten total:HDL-kolesterol, triglycerider, LDL-kolesterol).
De initiala studierna rörande låg-kolhydratkost var i regel korttidsstudier över veckor upp till 3
månader. Det har visat sig att metabola parametrar som vikt, HbA1C, och blodfetter inte stabiliserat
sig efter 3 månader, så status ≥1 år efter behandlingsstart bör vara utfallsmått.
Man kan alltså specificera sin PICO-fråga enligt följande:
Population/patientkategori
Intervention
Control
Outcome
Patienter med kost- eller
läkemedelsbehandlad typ-2
diabetes mellitus och BMI ≥25
Låg-kolhydratdiet där
≤40 E% tillgodoses med
kolhydrater
Låg-fettdiet med ≤30 E%
fett, 15-20 E% protein
och 50-55 E% kolhydrat
(med eller utan
specificerat GI-värde)
Förändring av HbA1C 1
år efter
behandlingsstart
1
Eftersom det inte är tillrådligt att öka proteinintaget hur mycket som helst innebär lågt kolhydratintag att
andelen fett med automatik ökar. Därför kallas låg-kolhydratdieter ofta för ”low carbohydrate high fat” (LCHF)dieter.
4
Eller mer fritt:
Bland patienter med kost- eller läkemedelsbehandlad typ-2 diabetes mellitus och BMI ≥25, leder lågkolhydratdiet med ≤40 E% kolhydrater till större förbättring av HbA1C 1 år efter behandlingsstart än
vad låg-fettdiet med ≤30 E% fett och 50-55% kolhydrat gör?
Liknande frågor kan sedan ställas med förändring av vikt, HDL-kolesterol, triglycerider som utfall. De
kan alla potentiellt besvaras med ett ja eller ett nej.
Beskriv din sökstrategi:
Cochrane Library
I bakgrundsinformationen till uppgiften framgår att du redan sökt på Cochrane Library, men att den i
och för sig helt relevanta översikten som du hittade inte var up-to-date. Som yrkesverksam läkare
bör Cochrane Library alltid vara ditt förstahandsval av databas. Cochrane Library består (främst) av
det som kallas Cochrane Reviews. Det är systematiska översikter, mycket noggrant utförda och man
brukar säga att dessa hamnar högst upp i evidenshierarkin (se nedan), åtminstone om den
systematiska översikten baserar sig på randomiserade kontrollerade prövningar (RCTs), vilket de
flesta Cochrane-översikter gör. Man måste vara medveten om att det finns förhållandevis få
Cochrane Reviews i Cochrane Library (drygt 6000), så sannolikheten för att hitta en översikt som
exakt svarar mot din PICO-fråga är ganska liten. Å andra sidan gör det begränsade antalet att det är
ganska lätt att söka: Man behöver i regel bara skriva en eller två söktermer för att få en träfflista som
man lätt kan gå igenom manuellt. Till yttermera visso är Cochrane-översikternas titlar strukturerade
enligt PICO-modellen och därmed är det mycket lätt att veta om en översikt är relevant för just dig.
På skärmdumpen på nästa sida visas vad som kom fram när jag skrev in ”low-carbohydrate diet type
2 diabetes” i Cohrane Library’s sökruta: Upp till vänster (den övre röda pilen) finns en lista med träffkategorier (Cochrane Reviews; Other Reviews; Trials; Methods Studies; Technology Assessments;
Economic Evaluations; Cochrane Groups) som man kan toggla emellan genom att klicka i ringarna till
vänster om kategorierna. Det visade sig finnas en Cochrane Review, och 40 Trials (i regel de
randomiserade kontrollerade prövningar som beaktats i de listade Cochrane Reviews). När man
klickar på en träffkategori listas alla enskilda träffar med titel, författare och klickbar länk lite längre
ned på sidan (den nedre röda pilen). Som du märker var det den Cochrane Review som redan
nämndes i bakgrunden till uppgiften, och som bara var up-to-date till och med 30 oktober 2006.
5
Systematiska och narrativa översikter (reviews)
Här är det på sin plats med en allmän kommentar om översiktsartiklar (eller ”reviews”). Man brukar
alltså dela upp översikter i systematiska och narrativa (berättande). Systematiska översikter karaktäriseras av att de följer en strikt metodologi, och till skillnad från narrativa översikter finns det en
metoddel, precis som i vanliga vetenskapliga originalartiklar. Metoddelen i vetenskapliga artiklar bör
vara så utformad att andra forskare ska kunna göra en ny studie på precis samma sätt och på så sätt
replikera resultaten. I metoddelen av systematiska översikter brukar man finna den vetenskapliga
frågan (i idealfallet formulerad enligt PICO-modellen), en noggrann beskrivning av sökstrategier och
av utfallet av sökningen, samt en detaljerad redogörelse för hur identifierade artiklar kvalitetsvärderades och hur resultaten sammanvägdes till en sammanfattande evidensgrad.
En av poängerna med systematiken i sökningarna är att hitta ALLA relevanta originalartiklar, inte bara
de som lättast kommer fram i en snabb sökning (det finns risk för att positiva studier publiceras i
bättre tidskrifter och får större uppmärksamhet medan negativa studier tenderar att hamna på
undanskymda platser i den medicinska litteraturen – publikationsbias!). I resultatdelen, eller som
supplementärt material, bör det finnas en lista med de relevanta artiklar som förkastats, med skälen
till varför de inte tagits med. Det bör också finnas tabeller som visar vilka studier som inkluderats,
gärna med information om vissa nyckeldetaljer. Slutsatserna bör vara evidensgraderade.
Om en systematisk översikt uppfyller dessa krav, bygger på flera välgjorda RCTs (randomiserade
kontrollerade trials, se nedan) med samstämmiga resultat, och dessutom är 100% relevant för din
frågeställning så är det bingo! I narrativa översiktsartiklar, å andra sidan, saknas garantier för att
litteraturen dammsugits och att alla artiklar beaktats. Det finns sällan en kvalitetsvärdering av inkluderade artiklar, och slutsatserna är inte evidensgraderade.
Även om det finns många bra narrativa översiktsartiklar (som kan vara väldigt värdefulla när man
snabbt ska sätta sig in i ett nytt område) så finns det också många exempel på riktigt dålig och
tendentiös redovisning. Vem som helst kan skriva en narrativ översikt; i typfallet är det en lokal
auktoritet som ligger bakom – inte sällan en känd proponent för en viss behandlingsstrategi, med
6
starka förutfattade meningar om sakernas tillstånd. Det kan vara svårt för författaren att låta bli att
särskilt lyfta fram artiklar som ger stöd för den egna åsikten. Eftersom den medicinska litteraturen är
enorm går det påtagligt ofta att hitta någon eller några artiklar som stöder ens åsikt, hur udda den än
må vara. Och om man tillåter sig att ”shoppa runt” och skippa allt som motsäger den egna tesen så
går det att driva nästan alla åsikter i bevis. Det finns också många exempel på översikter som skrivits
av författare med nära anknytning till kommersiella intressen (t.ex. läkemedelsbolag) och som haft
som uppenbart syfte att ”vända till” en sammantagen litteratur som inte varit särskilt positiv för det
egna företaget eller branschorganisationen till att se mera positiv ut.
Därför bör man undvika att basera EBM-slutsatser på narrativa översikter. Detta står i bjärt kontrast
till hur medicinsk kunskap spreds för 20-30 år sedan. Då lyssnade den breda medicinska professionen
främst på auktoriteter (läkemedelsindustrin kallar dem för opinion leaders), som spred sina budskap
via framträdanden på kongresser och via just narrativa översikter. Eftersom auktoriteterna var
auktoriteter just därför att de var extra kunniga inom sina områden så fungerade detta system ganska
hyggligt, men det var sårbart.
Evidenshierarki
Hittar man inga systematiska översikter baserade på RCTs måste man ha en strategi för att få fram
”det näst bästa”. Det är alltså viktigt att värdera identifierade artiklars kvalitet. Kvaliteten av en
enskild studie bestäms dels av studiedesignen, dels "utförandet" av studien. Studiedesignerna
evidensvärde kan schematiskt rangordnas (från bästa till sämsta) i:
1. SYSTEMATISK översikt baserad på flera randomiserade kontrollerade trials (RCTs).
2. Randomiserad kontrollerad trial.
3. Systematisk översikt baserad på flera observationsstudier (kohort- och fall-kontroll-studier)
4. Observationell prospektiv (framåtblickande) kohortstudie
5. Fall-kontroll-studie
6. Fallserie/patientmaterial utan jämförelsegrupp
7. Fallbeskrivning.
Den viktigaste vattendelaren går mellan nivå 2 och 3, nämligen mellan "experimentella" och
"observationella" ansatser. Om undersökaren kan allokera deltagare till den aktuella interventionen
respektive kontrollbetingelsen och detta sker strikt slumpvis så fördelas potentiellt viktiga olikheter
mellan olika patienter (t.ex. utgångsvikt, fysisk aktivitet, komplicerande co-morbiditet, dvs. faktorer
som kan påverka utfallet) lika mellan interventionsgrupp och kontrollgrupp. Om grupperna är
tillräckligt stora blir fördelningarna av dessa viktiga variabler nästan exakt lika i interventionsgruppen
och kontrollgruppen. Det enda som skiljer grupperna åt är just interventionen. Då har man eliminerat
tillblandning (confounding) av effekter från dessa störande variabler (confounders eller
förväxlingsfaktorer).
I observationsstudier kan man inte garantera att grupperna blir lika eftersom det inte är slumpen
som avgjort om en patient blivit föremål för den studerade behandlingen. Det finns nästan alltid ett
gott skäl till varför en patient får en viss behandling – skäl som ofta är kopplade till sannolikheten för
ett gynnsamt (eller ogynnsamt) hälsoutfall. På bilden på nästa sida ser du schematiskt hur två olika
potentiella förväxlingsfaktorer kan tänkas ändra ett samband mellan den studerade ”exponeringen”
låg-kolhydratdiet (blå ruta) och utfallet HbA1C (gul cirkel). Det är känt att hypertriglyceridemi leder till
7
förhöjda HbA1C-värden. Det är också rimligt att anta att diabetiker med förhöjda triglyceridvärden blir
rekommenderade att undvika låg-kolhydratkost (eftersom sådan kost med automatik innebär ett
högt fettintag – se ovan). Därför är sannolikt personer med hypertriglyceridemi underrepresenterade
bland diabetespatienter som följer en låg-kolhydratdiet, och det uppstår därmed ett omvänt
(negativt) samband mellan låg-kolhydratdiet och hypertriglyceridemi. Eftersom det senare tillståndet
tenderar att höja HbA1C uppstår ett falskt negativt samband mellan låg-kolhydratkost och HbA1C. En
ytterligare möjlig förväxlingsfaktor är hög fysisk
aktivitet; man kan gissa att personer som vurmar för
LCHF-diet också tränar mer än de som har en
”standarddiet” (låg-fett). Personer med hög fysisk
aktivitet är alltså sannolikt överrepresenterade
bland diabetespatienter som har en låg-kolhydratdiet, och eftersom den fysiska aktiviteten tenderar
att driva ned HbA1C uppstår ett falskt negativt
samband mellan låg-kolhydratdiet och HbA1C. För
att kunna vara en förväxlingsfaktor måste faktorn
själv påverka utfallet (positivt eller negativt) och dessutom vara positivt eller negativt associerad med
(men inte nödvändigtvis själv påverka) den studerade exponeringen.
Till skillnad från RCTs, där det är slumpen som gör att alla förväxlingsfaktorer – vare sig de är kända
eller okända – fördelas lika mellan behandlingsarmarna (och forskarna därför inte behöver bry sig
särskilt mycket om dessa faktorer), försöker man i observationsstudier istället MÄTA alla viktiga
förväxlingsfaktorer. Då kan man med statistiska metoder justera (kontrollera) för eventuella
olikheter mellan grupperna.
Om en RCT är slarvigt genomförd (t.ex. randomiseringsutfallet har kunnat förutses och manipuleras,
det har varit stort bortfall under uppföljningen, eller mätningen av utfallet kan ha påverkats av att
undersökarna kände till vilken behandlingsgrupp de utvärderade patienterna tillhörde) kan studien halka ned i rangordningen och till och med rankas lägre än en rigoröst genomförd observationell
kohortstudie med noggrann mätning av och strikt kontroll för alla tänkbara förväxlingsfaktorer.
Därför är det viktigt att kritiskt läsa igenom de artiklar som man får fram i sin sökning, och dessutom
att försäkra sig om att man inte missat relevanta träffar i kategori 1 och 2.
Sökning på PubMed
I PubMed finns drygt 21 miljoner referenser. Därför måste man vara mycket mer förfinad i sin
sökning än man behöver vara när man söker i Cochrane Library. I det följande avsnittet visas
exempel på hur sökningarna kan gå till. Exemplen illustreras av skärmbilder som kom upp när i
november 2012. Eftersom PubMed hela tiden fylls på med nya referenser kan de antal som anges på
skärmbilderna och i texten ha ändrats. Försök gärna att följa exemplen genom att själv söka på
PubMed, men bli inte förvirrad av att antalet träffar (och den numrering som anges längre fram) har
ökat på sig.
Ett bra sätt att lite enklare hitta klinisk forskning är att använda Clinical Queries som startpunkt. Det
hittar du på första sidan under PubMed Tools. Testa gärna den nästa gång du letar efter något i
PubMed!
8
Resultaten kommer i tre kategorier – (i) kliniska studier; (ii) systematiska översikter (kom ihåg att det
PubMed kallar för systematiska översikter också innefattar en del narrativa översikter och kliniska
guidelines/behandlingsrekommendationer – du kan inte utgå ifrån att allt som kommer upp är äkta
systematiska översikter, hur du känner igen en systematisk översikt har vi redan berört); (iii) studier
inriktade på medicinsk genetik.
Om du har en bra artikel som väl stämmer överens med det ämnesområde som du vill söka om –
utgå från den! I det här fallet hade dietisten gett dig två artiklar. Titta lite närmare på dem i PubMed!
9
Där kan du använda dig av både Related citations (längst till höger) och även titta närmare på MeSHtermerna. Dessa hittar du under abstractet, Publication types, MeSH Terms (klicka på plus-tecknet
så öppnar sig listorna). På det viset får du tips på relevanta MeSH-termer som du kan använda i din
sökning.
PubMeds styrka ligger i att man kan sk fritextsöka. I sökrutan kan man enkelt skriva in de termer
man vill söka på, även om de inte är MeSH-termer. PubMed ”mappar” dessa till lämpliga MeSHtermer. Titta lite längre ner på sidan med träffresultatet. Till höger finns en ruta som heter Search
Details. Klicka på See more och du ser hur din sökning tolkats.
10
Det finns inte EN perfekt sökning som fångar precis allt man vill ha. Man behöver söka på lite olika
sätt i PubMed, och man behöver oftast också komplettera en sökning i PubMed och Cochrane med
ytterligare sökning i en tredje databas. Såvida det inte finns en Cochrane Review som perfekt svarar
på just din frågeställning!
MeSH-baserad sökning i PubMed (pröva gärna att själv replikera nedanstående)
Börja med att gå in på MeSH-browsern genom att klicka på MeSH Database under ”More Resources”.
I MeSH-sökfönstret högst upp i det gråa fältet skriver du något som ungefär beskriver vad du är ute
efter. Det är ju en diet du vill studera och skriver därför bara diet och klickar sedan på ”Search”.
Du får ganska många termer att välja på, men ser att den tredje passar dig; ”Diet, CarbohydrateRestricted”. Om du vill ha den som sökterm klickar du i rutan till vänster om termen, men om du vill
avgränsa till mer specificerade aspekter klickar du på själva den blåa termen.
11
Då får du fram en sida med olika aspekter (”subheadings”) av ”Diet, Carbohydrate-Restricted”. Du
finner ingen subheading som ser ut att passa, och eftersom det här redan är en ganska ”smal” term
väljer du ingen subheading (som i regel begränsar en sökning ganska mycket), utan du klickar direkt
på ”Add to Search Builder”.
Att göra sin sökning via MeSH Database är en god idé av flera anledningar. Du kan se var din term
ligger i hierarkin (”trädet”). Du kan också se när en MeSH-term är introducerad. MeSH:en är inte
12
statisk utan följer forskningen och omvärlden. Du noterar att ”Diet, Carbohydrate-Restricted”
introducerades så sent som 2006 och känner dig inte helt säker på att du får med alla relevanta
artiklar där kolhydratinnehållet varieras. På samma sida ser du också Previous Indexing. 2006
introducerades alltså ”Diet, Carbohydrate-Restricted”, innan dess indexerade man med både ”Diet
Therapy” och ”Dietary Carbohydrates” för att beskriva att det handlade om en diet som innehöll få
kolhydrater. För att vidga sökningen rörande kolhydrat i kosten bestämmer du dig för att även ta
med ”Dietary carbohydrates”. Du klickar därför på ”Dietary Carbohydrates (1973-2005)” under
Previous Indexing” nedtill i nedanstående vy.
Du finner att Dietary Carbohydrates har ganska många subheadings, och när du snabbt tittar igenom
dem finner du att kategorin ”Therapeutic use” skulle kunna begränsa sökningen något – dietbehandling måste ju anses vara ”terapeutisk användning”! Du klickar alltså i rutan för subheading
”Therapeutic use”. Innan du klickar på ”Add to search builder” måste du betänka att du vill vidga
sökbegreppet ”Diet, Carbohydrate-Restricted” och alltså önskar hitta alla artiklar som endera har
indexeringen ”Diet, Carbohydrate-Restricted” eller ”Dietary Carbohydrates/therapeutic use”. Då
väljer du den Booleanska operatorn ”OR” i fönstret till höger om ”Add to search builder”-knappen.
Kom alltså ihåg att AND begränsar sökningen medan OR vidgar den (”OR is mORe”). När du sedan
klickat på ”Add to search builder” läggs OR ”Dietary Carbohydrates/therapeutic use”[Mesh] till de
redan existerande termerna i sökbyggarfönstret.
13
Till termerna om kolhydratfattig diet ska vi ju lägga diabetes. Töm sökfönstret upptill i det gråa fältet
genom att klicka på det gråa krysset till höger, skriv diabetes i fältet och klicka på ”Search”. Då får du
upp en sida med olika förslag. Där hittar du ”Diabetes Mellitus, Type 2”. Om du vill ha den som
sökterm klickar du i rutan till vänster om termen, men om du vill avgränsa till mer specificerade
aspekter klickar du på själva den blåa termen.
Då får du fram en vy med olika subheadings av diabetes mellitus, typ 2. En MeSH-term som Diabetes
Mellitus, Type 2 täcker ett stort forskningsområde, och då är en (eller flera) subheadings en god idé
för att bättre snäva in på den aspekt av den term man söker på. Eftersom din fråga handlar om
dietbehandling klickar du i rutan ”diet therapy” och sedan på ”Add to search builder”. Då kommer
”Diabetes Mellitus, Type 2/diet therapy”[Mesh] upp i sökfönstret.
14
Observera att du använder den Booleanska operatorn ”AND” (i fönstret till höger om knappen)
eftersom du bara vill ha artiklar som handlar om både diabetes mellitus typ 2 och låg-kolhydratdiet.
Eller mer precist: Du vill ha artiklar som handlar om både ”Diabetes Mellitus, Type 2/diet therapy”
och endera av ”Diet, Carbohydrate-Restricted” eller ”Dietary Carbohydrates/therapeutic use”. Om
man har för avsikt att använda den booleska operatorn OR, är det bra att börja med dessa termer
och sen lägga till den term man vill använda med AND:
("Diet, Carbohydrate-Restricted"[MeSH] OR "Dietary Carbohydrates/therapeutic use"[MeSH]) AND
("Diabetes Mellitus, Type 2/diet therapy"[MeSH])
Om du bytt plats och börjat med ("Diabetes Mellitus, Type 2/diet therapy"[MeSH]), kan det bli fel.
Databaser (inkl PubMed) ger alltid möjligheten att kombinera söktermer med AND, OR och NOT.
Dock är det inte alltid som databaserna (inkl PubMed) klarar av att tolka din sökning korrekt. Hade du
börjat med diabetes, och sedan lagt till de söktermer som du vill ska komplettera varandra och därför
ska ha ett OR emellan hade söktermen i ”Search Builder” sett ut ungefär så här:
("Diabetes Mellitus, Type 2/diet therapy"[MeSH] AND "Diet, Carbohydrate-Restricted"[MeSH]) OR
"Dietary Carbohydrates/therapeutic use"[MeSH]
Fundera på hur den skiljer sig från söktermen nederst på föregående sida! Den ena ger 264 träffar
och den andra 11456 (när denna kommentar skrevs – antalet växer allteftersom nya artiklar
publiceras). Skillnaden har att göra med hur parenteserna är placerade. Intuitivt är det lätt att förstå
att man vill hålla ihop uttrycket för ”endera av Diet, Carbohydrate-Restricted eller Dietary
Carbohydrates/therapeutic use”. Därför vill man sätta dessa två termer inom en och samma
parentes. Då får man fram alla artiklar som just handlar både om ”Diabetes Mellitus, Type 2/diet
therapy” och endera av ”Diet, Carbohydrate-Restricted” eller ”Dietary Carbohydrates/therapeutic
use”. Det är 264 stycken. Om parentesen istället hamnar runt "Diabetes Mellitus, Type 2/diet
therapy” AND "Diet, Carbohydrate-Restricted" och lämnar ”OR Dietary Carbohydrates/therapeutic
use” utanför, kommer man att dels få fram alla artiklar som handlar om både ”Diabetes Mellitus,
Type 2/diet therapy” och "Diet, Carbohydrate-Restricted”, men dessutom alla artiklar som handlar
om ”Dietary Carbohydrates/therapeutic use”. Tillsammans utgör de 11456 stycken.
15
När man sätter samman tre sökbegrepp i PubMeds Search Builder skapas en parentes runt de 2
första, medan det tredje och sista hamnar utanför parentesen. Det är därför som man får olika
resultat när man börjar med ”Diet, Carbohydrate-Restricted OR Dietary Carbohydrates/ therapeutic
use” än när man börjar med "Diabetes Mellitus, Type 2/diet therapy”.
Det är alltid en god idé att titta på Search Details och sen klicka på See more för att se hur PubMed
tolkat din sökning (observera att antalet träffar som anges i skärmdumparna nedan avviker något
från dem som nämns i texten och som du får fram om du själv gör en sökning eftersom det hela tiden
kommer in nya artiklar i systemet).
När du klickat på ”See more” kommer detta fönster upp:
Ett sätt att komma runt problemen med parentesen är att göra din MeSH-sökning i två delar och
sedan sätta ihop dem med ”Advanced”-funktionen. Då spelar det ingen roll om du börjar med
diabetes eller med dieterna. Du kan följa samma i samma spår som tidigare. Låt oss denna gång börja
med att söka MeSH-termen för typ-2 diabetes, kryssa för subheadingen ”diet therapy”, och klicka
sedan på ”Add to search builder”. Men istället för att lägga till sökbegrepp för låg-kolhydratdiet och
dietärt kolhydrat/therapeutic use (så som vi beskrivit tidigare) så klickar du på ”Search PubMed” och
gör därmed din första sökning. Då får du cirka 1889 träffar, som alla rör Diabetes Mellitus, Type
2/diet therapy, men inte nödvändigtvis låg-kolhydratdiet.
16
Klicka sedan på ”Bakåt-pilen” längst upp till vänster på skärmen så att du kommer tillbaka till MeSHdatabasen. Där söker du på ”diet”, precis som beskrivits tidigare, klickar på ”Diet, CarbohydrateRestricted” och sedan på ”Add to search builder”. Därefter letar du upp ”Dietary Carbohydrates”
under ”Previous indexing” längre ned till vänster på samma MeSH-sida, klickar där för att få upp
subheadings för ”Dietary Carbohydrates” och bockar för ”therapeutic use”. Efter att ha ändrat den
Booleanska operatorn till OR klickar du på ”Add to search builder”. Sedan gör du din andra sökning
genom att klicka på ”Search PubMed”. Inte mindre än cirka 11952 träffar kommer upp (med OR får
du upp alla artiklar som är indexerade med ”Diet, Carbohydrate-Restricted” och alla artiklar som
indexerats med ”Dietary Carbohydrates/ therapeutic use”). När du klickar på ”Advanced” kommer du
till PubMed Advanced Search Builder:
Där finner du dina två sökningar (markerade med röda pilar). Numreringen (#10 och #9) behöver du
inte bry dig om – den nollställs efter 8 timmars inaktivitet, men sedan räknar PubMed varje gång du
trycker på ”Search”-knappen. Så ju högre nummer, desto senare sökning. Min första sökning fick
nummer #9 och min andra sökning fick nummer #10. De sökbegrepp som ingår i en numrerad
sökning hör ihop. Det motsvarar den parentes som nämndes tidigare. Så nu är det bara att
kombinera de två sökningarna. Du kan börja med att klicka på ”#9” (men hade lika gärna kunnat
börja med ”#10”). Då kommer en dialogruta, på vilken du ska ange vad du vill göra. Överst står de
Booleanska operatorerna AND, OR och NOT. Om du vill ”addera” sökning #9 till den kombinerade,
17
slutliga sökningen klickar du på AND. Du hade lika gärna kunnat klicka på ”Add” i kolumnen ”Add to
builder” (se nästa sida).
Då kommer ”#9” upp på första raden i ”Builder” mitt vyn. Sedan gör du samma sak med ”#10”. Kom
ihåg att de två söktermerna i sökning #10 hålls ihop, så du ska bara kombinera den sökningen med
sökning #9 och därmed ha ett AND emellan. Så du klickar på AND, varvid ”#10” läggs till på den andra
raden i ”Builder” med ett ”AND” i det lilla fönstret till vänster om raden. I ”Builder” kan man sedan
ändra den Booleanska operatorn, ta bort sökningar (med det lilla minustecknet till höger om
raderna), samt lägga till ytterligare sökbegrepp genom att först lägga till en rad (tryck på plus-tecknet
till höger om nedersta raden), välja ett av PubMeds index-kategorifält från en rullgardinslista (där det
först står ”All Fields”) och specificerad sökterm från en klickbar indexlista längst till höger om raden.
Pröva gärna själv! När du är nöjd är det bara att klicka på ”Search”:
Och fram kommer 264 träffar. Voilà!
18
Men antalet träffar är fortfarande för stort för att kunna gå igenom manuellt. För att ytterligare
begränsa antalet artiklar vill du hålla dig till sådana artiklar som verkligen är relevanta. Då vill du
använda dig av de filter som finns åtkomliga längst till vänster i resultatvyn. Filtren finns grupperade i
kategorier som t.ex. ”Text availability”, ”Publication dates”, ”Species”, ”Article types”. Den lista som
visas är inte komplett. Vill du få fram ytterligare alternativ kan du klicka på ”more” som står under
alternativen i vissa kategorier, eller klicka på ”Show additional filters” (se skärmdumpen nedan). Då
öppnar sig pop-up-fönster med många olika alternativ. Där kan man verkligen shoppa loss! Filtren
aktiveras genom att du klickar på dem i listan till vänster.
Vad är du intresserad av? För det första – du vill ha evidens från människor, inte djur. Därför klickar
du på ”Humans” under ”Species”. Enligt evidenshierarkin vill du hitta randomiserade kontrollerade
prövningar (eller helst systematiska översikter av randomiserade studier), så du klickar på
”Randomized Controlled Trials” och ”Systematic Reviews” under ”Article types” (det är lite trixigt
19
eftersom listan ändrar sig när man bockat för ett av alternativen – därför måste man klicka på
”more” och får då upp en mycket lång lista med alternativa filter som man måste scrolla igenom). Jag
har redan varnat för att PubMed i begreppet ”systematic reviews” kan inkludera sådant som inte
uppfyller kriterierna för systematiska översikter på sidan 6 (en riktig metoddel med heltäckande
sökstrategier, inklusions- och exklusionskriterier, standardiserad kvalitetsgranskning av identifierade
artiklar, redovisning av totalantalet träffar och alla exklusioner). Därför måste man själv ögna igenom
de översikter som PubMed anser vara systematiska. Men om det överhuvudtaget finns några
systematiska översikter borde de komma upp med termen ”Systematic Reviews”. Ett alternativt
sökbegrepp är ”Meta-analysis”, som ju egentligen inte är synonymt med systematisk översikt; metaanalys är en statistisk metod för att väga samman resultat från flera olika studier, medan systematiska översikter är mycket mer än så. Men med ”Meta-analysis” brukar man i PubMed få upp de
flesta systematiska översikter som finns, tillsammans med en hel del narrativa översikter. Slutligen
vill du begränsa sökningen till vuxna och kryssar därför för ”All Adults 19+ years” under ”Ages”.
Därefter klickar du på Search-knappen.
Då får du en ny träfflista, som denna gång bara innehåller 69 träffar. De är listade med den senaste
artikeln överst. Sedan får du manuellt gå igenom träffarna. Många kan du identifiera som potentiellt
relevanta eller avfärda som irrelevanta bara genom att läsa titeln, för andra blir det uppenbart när du
läser abstracten. I några fall måste du ta fram artiklarna i fulltext. Och slutligen kvarstår de artiklar
som du måste läsa och värdera mera noggrant. I regel är de förvånansvärt få i förhållande till det
totala antalet träffar som man fick från början.
Notera varningsmärket för aktiverade ”limits”. Om du gör en ny sökning i samma seans ligger de kvar
och kan vålla huvudbry. För att bli av med dem måste du klicka på ”Clear all” uppe till vänster.
Man kan ju tycka att det är ett problem att antalet träffar kan variera så markant med hur man
bygger sina söktermer. Det lämnar ju en med en obehaglig känsla av att man kanske trots allt missat
någon viktig referens. Och det enkla svaret är att med en så här enkel ansats så finns det en risk att
man missar ett och annat. I professionell EBM (t.ex. Cohrane; Statens Beredning för Medicinsk
Utvärdering [SBU] – en svensk myndighet som producerar stora systematiska översikter) löser man
20
detta dilemma genom att lägga ut väldigt breda sökningar, ofta med den Booleanska operatorn ”OR”
mellan söktermerna så att man fångar in många tusentals träffar, som man sedan manuellt får gå
igenom. Därefter går man igenom relevanta träffars referenslistor, och det är först när man känner
att man bara träffar på sådant som man redan hittat tidigare som man slutar söka. Det är därför som
det tar år att skriva en Cochranerapport (och i typfallet 2-3 år att skriva en SBU-rapport), och det är
därför som sådana systematiska översikter är överlägsna. Det är förstås inget man hinner göra
mellan två patienter. Men även om ambitionsnivån är betydligt lägre i ”vardagligt” EBM-arbete ute i
kliniken så kan man träna upp sig. Det är en fördel att så långt det är möjligt använda MeSH-termer,
som sedan kan avgränsas mer specifikt än fritexttermer, men man måste också helt enkelt pröva sig
fram. När man går igenom resultaten av sina sökningar kan det vara bra att också titta på ”Related
citations” bredvid abstracten i PubMed. När man inte kan hitta någon lämplig MeSH-term handlar
det om att försöka föreställa sig hur författare av relevanta publikationer skulle uttrycka sig i titlar
eller abstract. Det lär man sig i sin tur genom att läsa mycket medicinska artiklar, så det handlar om
övning, övning, övning. Det är lite som att lösa korsord – den som är van korsordslösare anar ofta
vilka klurigheter korsordskonstruktören tänkt ut. Och när man blivit van EBM:are så brukar man ofta
åstadkomma en ganska heltäckande sökning på bara 15-30 minuter. Men den blir förstås inte lika bra
som en Cochrane- eller SBU-sökning.
Vilka artiklar beaktade du i din i din slutsats? (tips när du läser: ett kolhydratintag på 40 E% motsvarar
200 gram vid 2000 kcal/dag eller 150 gram 1500 kcal/dag. Ett kolhydratintag på 40 gram/dag motsvarar 8 E%
vid 2000 kcal/dag och 11 E% vid 1500 kcal/dag):
När man fått ordning på sin sökning och fått fram ett hanterligt antal träffar, som någorlunda verkar
täcka PICO-frågan, bör ordningen vara att man FÖRST försöker vaska fram de artiklar som är
relevanta. Man brukar börja med att sortera bort sådana artiklar som man redan på titeln kan se är
irrelevanta. Sedan ögnar man igenom abstracten för de artiklar som blir kvar. Vad man bör leta efter
är artiklar som har stark studiedesign (RCTs och systematiska översikter) och som dessutom har rätt
intervention (låg-kolhydratdiet där ≤40 E% tillgodoses med kolhydrater) och rätt utfall (förändring av
HbA1C 1 år efter behandlingsstart), alltså rätt I och rätt O i din PICO. Sedan läser man bara de artiklar
som uppfyller dessa kriterier (och börjar med metoddelen för att se om studien verkar tillräckligt
väldesignad för att läsa fullt ut). Jag kan lova dig att det i de allra flesta fall inte blir mer än vad man
kan räkna på sina tio fingrar. Om det inte blir någon kvar (och det är inte ovanligt) får man sänka
kravet något och även inkludera observationsstudier, i första hand prospektiva (framåtblickande)
kohortstudier.
Eftersom en Cochrane-översikt indikerade att det inte fanns några studier av godtagbar kvalitet fram
t.o.m. 2006 behöver du i det här fallet kanske inte gå igenom alla relevanta träffar i din träfflista.
Även om du gjort det skulle du finna att de fem nyckelreferenser (RCTs av lågkolhydratdiet enligt din
definition under I i PICO, jämfört med lågfettdiet enligt din definition under C, och med ≥1 års
uppföljning) som fanns i träfflistan påträffades bland de 20 första posterna, nämligen:
8: Larsen RN, Mann NJ, Maclean E, Shaw JE. The effect of high-protein, low-carbohydrate diets in the
treatment of type 2 diabetes: a 12 month randomized controlled trial. Diabetologia. 2011
Apr;54(4):731-40. PubMed PMID: 21246185.
21
11: Elhayany A, Lustman A, Abel R, Attal-Singer J, Vinker S. A low carbohydrate Mediterranean diet
improves cardiovascular risk factors and diabetes control among overweight patients with type 2
diabetes mellitus: a 1-year prospective randomized intervention study. Diabetes Obes Metab. 2010
Mar;12(3):204-9. PubMed PMID: 20151996.
12: Iqbal N, Vetter ML, Moore RH, Chittams JL, Dalton-Bakes CV, Dowd M, Williams-Smith C, Cardillo
S, Wadden TA. Effects of a low-intensity intervention that prescribed a low-carbohydrate vs. a low-fat
diet in obese, diabetic participants. Obesity (Silver Spring). 2010 Sep;18(9):1733-8. Epub 2009 Dec 17.
PubMed PMID: 20019677.
14: Davis NJ, Tomuta N, Schechter C, Isasi CR, Segal-Isaacson CJ, Stein D, Zonszein J, Wylie-Rosett J.
Comparative study of the effects of a 1-year dietary intervention of a low-carbohydrate diet versus a
low-fat diet on weight and glycemic control in type 2 diabetes. Diabetes Care. 2009 Jul;32(7):114752. Epub 2009 Apr 14. PubMed PMID: 19366978; PubMed Central PMCID: PMC2699720.
20: Wolever TM, Gibbs AL, Mehling C, Chiasson JL, Connelly PW, Josse RG, Leiter LA, Maheux P,
Rabasa-Lhoret R, Rodger NW, Ryan EA. The Canadian Trial of Carbohydrates in Diabetes (CCD), a 1-y
controlled trial of low-glycemic-index dietary carbohydrate in type 2 diabetes: no effect on glycated
hemoglobin but reduction in C-reactive protein. Am J Clin Nutr. 2008 Jan;87(1):114-25. PubMed
PMID: 18175744.
De som istället för att göra en MeSH-sökning gjorde en fritextsökning fick ett styvare jobb. Som vi
redan inledningsvis kunde konstatera gav fritextsökningen ”type 2 diabetes low carbohydrate diet”
505 träffar, och med samma filter som i vår MeSH-baserade sökning återstod 132 artiklar att gå
igenom manuellt. Man kan konstatera att alla ovan nämnda artiklar kom med, men Larsen och
medarbetares artikel (som i MeSH-sökningen återfanns som nummer 8) nu hittades först på 20:e
plats. Elhayany och medarbetares artikel (nummer 11 i MeSH-sökningen) återfanns som nummer 29.
Iqbal och medarbetares artikel ramlade ned från nummer 12 till nummer 34, Davis och medarbetares
artikel från 14 till 39, och Wolever och medarbetares artikel från 20 till 49. Denna observation är ett
starkt argument för att generellt försöka använda MeSH-baserade sökningar, som går att styra och
avgränsa på ett bättre sätt. Å andra sidan identifierade de en relevant studie som inte kom med i den
MeSH-baserade sökningen, nämligen:
4: Guldbrand H, Dizdar B, Bunjaku B, Lindström T, Bachrach-Lindström M, Fredrikson M, Ostgren CJ,
Nystrom FH. In type 2 diabetes, randomisation to advice to follow a low-carbohydrate diet
transiently improves glycaemic control compared with advice to follow a low-fat diet producing a
similar weight loss. Diabetologia. 2012 Aug;55(8):2118-27. PubMed PMID: 22562179.
Detta visar att MeSH-sökningens framgång beror på i vilken utsträckning alla relevanta artiklar blivit
korrekt indexerade (och att vi själva inte varit för snäva i vår sökning). I det här fallet har artikeln av
någon anledning indexerats som ”diabetes mellitus type 2/therapy” (alltså inte subheading ”diet
therapy”, som vi begränsade vår sökning till). Dessutom var den indexerad som ”diet, carbohydrate
restricted”, och inte ”diet, carbohydrate restricted/therapeutic use” som vi använde som sökterm.
Hade vi i vår MeSH-sökning använt söktermen ”diabetes mellitus” eller ”diabetes mellitus, type 2”
utan subheading hade vi fått med den. Samma sak om vi hade använt ”diet, carbohydrate restricted”
utan subheading. Man måste alltså ta med i beräkningarna att det kan finnas enstaka relevanta
artiklar dolda under näraliggande subheadings. Hade vi å andra sidan gått på breda söktermer utan
22
de restriktioner som subheadings innebär hade vi riskerat att drunkna i artiklar; om vi till exempel
sökt på ("Diet, Carbohydrate-Restricted"[MeSH] OR "Dietary Carbohydrates"[MeSH]) AND "Diabetes
Mellitus, Type 2"[MeSH] så hade vi fått 999 träffar (195 efter att ha lagt på filtren) och hittat de
relevanta artiklarna mellan nummer 7 (Guldbrands studie) och 59 (Wolevers studie). Det blir alltså
väldigt mycket manuellt arbete och är inte en sökning som man hinner med mellan två patienter!
Jag vill lyfta fram ytterligare en poäng: Artiklar kan missas vid MeSH-baserade sökningar, liksom vid
fritextsökningen med filter (eftersom filtren också bygger på MeSH-termer), om de är så nya att de
ännu inte hunnit indexerats. Det kan månader innan nya artiklar processats. Om man vill vara absolut
säker på att inte missa någonting måste man göra flera olika sökningar med olika kombinationer av
sökbegrepp. Och vill man få med det allra senaste måste man göra fritextsökningar med ord som
man kan anta finns i titlarna och/eller abstracten, utan att använda filter. Sådana sökningar ger ju i
allmänhet väldigt mycket träffar, men eftersom problemet bara gäller de allra nyaste artiklarna (som
ju alltid kommer först i träfflistan) så behöver man oftast bara gå igenom de första 20-30 träffarna
manuellt. Men det är det här ”finliret” som gör att systematiska översikter producerade av
professionella EBM-aktörer som Cochrane eller SBU kan ta år att genomföra.
Kvalitetsgranskning av artiklar
En viktig del i EBM-arbetet är att bedöma kvaliteten på de artiklar som kommit upp. Vi har redan
konstaterat att studiedesignen är en viktig aspekt på kvalitet – det är i princip RCTs och systematiska
översikter (helst baserade på RCTs) som har högst värde. Orsakerna till detta har berörts i tidigare
avsnitt. Men därutöver måste man bedöma om utförandet av studien hållit måttet. Studiedesignen
är i sig ingen garanti emot systematiska fel.
Extern validitet
När man bedömer hoten mot en studies ”validitet” (giltighet – dvs. om studien verkligen mäter det
den utger sig för att mäta) brukar man skilja mellan ”intern validitet” och ”extern validitet”. Extern
validitet handlar om huruvida studiens resultat kan generaliseras till andra än dem som ingick i
studien. Vad var det egentligen för patienter som ingick i studien? Hur hade de rekryterats? Vad var
inklusions- och exklusionskriterier, och var de rimliga? Är utfallet rimligt och relevant för den kliniska
frågeställningen? I kliniska behandlingsstudier ska idealt alla nya patienter, precis i den ordning som
de kommer till kliniken, tillfrågas om deltagande. Det kallas konsekutiva patienter. Gå gärna in på
CONSORT (http://www.consort-statement.org), som är en webbsajt med ambitionen att öka
kvaliteten på rapporteringen från kliniska prövningar. Där finner du bl.a. en checklista över vad som
bör vara med i en fullödig rapport. Ett viktigt verktyg för att bedöma kvaliteten på studien är ett
flödesdiagram, som beskriver flödet av patienter genom studien. Flödesdiagrammet återfinns på
nästa sida. En RCT av god kvalitet bör alltid ha ett sådant flödesdiagram. Man delar upp studien i
rekryteringsfas (enrollment), behandlingstilldelning (allocation – idealt genom randomisering),
uppföljning (follow-up) och analysfas (analysis). Det är under rekryteringsfasen som den externa
validiteten avgörs. I flödesdiagrammet bör det anges hur många patienter som beaktades och som
bedömdes avseende valbarhet (eligibility – uppfyllde inklusionskriterierna) i studien, hur många som
hoppades över därför att de inte uppfyllde inklusionskriterierna, hur många som avböjde deltagande
(om en stor andel av alla valbara patienter avböjer att delta kan den grupp som slutligen deltar vara
väldigt speciell), och hur många som uteslöts av andra anledningar. Bland de sistnämnda finns de
23
som uppfyllt något exklusionskriterium. Exklusionskriterier kan t.ex. vara överkänslighet för någon av
de behandlingar som ingår i studien, patientkategorier som man av försiktighetsskäl inte vågar
exponera för ett nytt och ännu förhållandevis oprövat läkemedel (t.ex. patienter med andra allvarliga
sjukdomar, gravida eller ammande kvinnor, eller kvinnor som kan bli gravida under prövningen),
samt grupper som man misstänker kommer att ha dålig följsamhet med tilldelade behandlingar och
som kanske i värsta fall hoppar av studien under pågående uppföljning (drop-outs). Det kan vara
missbrukare och/eller psykiskt instabila personer. Sådana exklusionskriterier är rimliga. Men om det
är många som uteslutits av ytterligare andra orsaker eller av oklar anledning kan man möjligen
misstänka att undersökarna haft en förutfattad mening om vilken behandling som varit bäst och att
behandlingsallokeringen kunnat förutsägas. Om så varit fallet kan det tänkas att undersökarna
uteslutit patienter som de tror inte ”passar” för den ena eller andra behandlingen. Då finns det stor
risk för att det finns problem med den interna validiteten (se nedan).
24
Intern validitet
Intern validitet handlar om i vilken utsträckning de observerade effekterna är verkliga eller beror på
(eller påverkats av) olika typer av systematiska fel (bias). Gick randomiseringen schysst till? Kunde
randomiseringsutfallet förutses eller manipuleras? Idag krävs att randomiseringsförfarandet
beskrivits i detalj i den publicerade artikeln. Exempel på acceptabla randomiseringsförfaranden är
dragning av i förväg iordningsställda lappar med anvisning om vilken läkemedelsföpackning som
patienten ska få (under förutsättning att lapparna ligger i slutna kuvert och det inte går att lista ut
innehållet genom att hålla kuverten mot ljuset), och i förväg iordningsställda datorgenerade
randomiseringslistor (under förutsättning att listorna hålls enbart av ett oberoende
allokeringssekretariat dit undersökarna måste ringa för att få anvisning om vilken förpackning som
patienten ska tilldelas). Tärningskast eller färdiga randomiseringslistor som gör det möjligt för
undersökarna att i förväg se vilken behandling som är ”på tur” är inte acceptabla metoder därför att
de kan manipuleras och/eller förutsägas. Resulterade randomiseringen verkligen i fullt jämförbara
grupper eller fanns det viktiga obalanser vad gäller faktorer på kan tänkas påverka utfallet?
Behandlingsarmarnas likvärdighet brukar redovisas i en RCTs första tabell. Där kan man se om
faktorer som kan tänkas påverka utfallet är fördelade mellan behandlingsarmarna.
Fick deltagarna verkligen den föreskrivna behandlingen? Hur var följsamheten med behandlingen
(compliance [”discontinued intervention”, se ovanstående flödesdiagram])? Uteslöts deltagare från
studien efter randomisering (genom aktivt beslut från forskarna – withdrawals [”did not receive
allocated intervention”]) eller självvalt (dropouts [”lost to follow-up”])? Om det var många som
uteslöts på grund av withdrawal, loss-to-follow-up eller non-compliance, om de som uteslutits hade
en annan sannolikhet för att uppnå utfallet än de som inte uteslöts, och andelen som uteslöts var
olika i behandlingsgrupp och kontrollgrupp finns det stor risk för att selektionsbias introduceras i
studien. Selektionsbias yttrar sig som positiva eller negativa samband mellan den studerade
behandlingen och förväxlingsfaktorer som påverkar sannolikheten för utfallet. Då kan man plötsligt
ha fått problem med confounding, trots att det är en randomiserad studie.
Tänk dig till exempel att du genomför en RCT av en aktiv behandling mot lunginflammation (med
placebo som jämförelse), men att den aktiva behandlingen har en biverkan som främst gör sig
påmind hos rökare, så att många rökare i
behandlingsgruppen hoppar av studien.
Tänk dig också att rökning inverkar negativt
på läkningen av lunginflammationer. Om
oproportionerligt många rökare hoppar av
just från den aktiva behandlingsarmen, och
man bara analyserar dem som genomfört
hela studien enligt protokollet kommer den
aktiva behandlingsarmen då att innehålla en mindre andel rökare än kontrollarmen. Det kan leda till
att resultaten vad gäller andelen som tillfrisknat blir bättre i den aktiva behandlingsarmen, inte bara
på grund av läkemedelseffekten, utan på grund av selektionsbias orsakad av bortfallet. Det har alltså
uppstått ett omvänt samband mellan den aktiva behandlingen och andelen rökare, och man har
plötsligt fått confounding från rökning (effekten av den aktiva behandlingen blandas med effekten av
att ha färre rökare i behandlingsarmen).
25
Som en tumregel kan man säga att om mindre än 10% av deltagarna uteslutits/fallit bort efter
randomiseringen är det osannolikt att eventuellt resulterande selektionsbias har haft avgörande
betydelse för resultatet, medan om mer än 30% fallit bort är risken överhängande (särskilt om
andelen som fallit bort i behandlingsgruppen skiljer sig markant från motsvarande andel i
kontrollgruppen).
Kan man misstänka att utfallet i studien bedömdes olika bland patienter som randomiserats till den
studerade interventionen jämfört med dem som randomiserats till kontrollgruppen? Om de som
bedömde behandlingsutfallet känt till vilken behandlingsgrupp deltagarna ingick i finns risk för
informationsbias om utfallet. Om man som undersökare tror starkt på den nya behandlingen är det
väldigt lätt att man bedömer utfallet bland dem som fått den nya behandlingen mer ”välvilligt” än
bland dem som fått jämförelsebehandlingen. Denna risk kan minskas avsevärt om utvärderarna är
ovetande om (”blindade” för) vilken behandlingsgrupp patienterna ingått i. Detta kallas för en enkelblind studie. För att ytterligare minska risken att utvärderaren av utfallet ska styras av vetskapen om
behandlingstilldelningen är det vanligt att såväl patienterna själva som utvärderarna av utfallet
(undersökarna) är blindade för behandlingsallokeringen. Då finns det ingen risk för att patienterna
försäger sig. Detta kallas för en dubbel-blind studie, vilket är något av standard när det gäller RCTs av
läkemedel. Är man riktigt rigorös behålls blindningen under hela analysfasen (de som analyserar
känner bara till att vissa patienter fick behandling A och andra fick behandling B, men inte vilken av
behandlingarna som var den studerade nya behandlingen och vilken som var kontrollbehandlingen).
Detta kallas för en trippel-blind studie, och koden bryts först när alla analyser är slutförda.
Systematiska fel kan även uppstå under analysfasen. Om många deltagare utesluts ur analysen (t.ex.
därför att insamlade data varit ofullständiga) kan selektionsbias uppstå. Därför bör antalet som
uteslutits i analysen redovisas i flödesdiagrammet. Bias kan även uppstå om studien har många
alternativa utfallsmått och undersökarna inte i förväg definierat vad som är det primära utfallsmåttet. Den statistiska analysen går ut på att bedöma hur stor sannolikheten är att – om nollhypotesen är sann och det faktiskt inte finns någon effekt – av ren slump ändå få ett falskt positivt
resultat som är lika extremt som, eller mer extremt än, det som erhållits. Det är det som P-värdet
anger. Man vill ju ge slumpen så liten betydelse som möjligt, så P-värdet bör vara lågt. Någonstans
måste man sätta en gräns där man anser att slumpen är utesluten som förklaring till det erhållna
resultatet. Av konvention brukar man sätta den gränsen till 0,05 eller 5%. Det betyder att om man
skulle upprepa exakt samma studie 100 gånger (och det faktiskt inte finns någon effekt) kommer
man att få ett falskt positivt resultat (”statistiskt signifikant” – p<0,05) bara på grund av slumpen vid
endast fem av dessa upprepningar. Alla som är bekanta med sannolikhetslära vet dock att ju fler
försök man gör, desto större blir chansen att få ett /falskt positivt/ statistiskt signifikant resultat; det
är som att kasta en tärning – om du bara får hålla på att kasta din tärning tillräckligt många gånger så
får du till slut upp en sexa. På samma sätt är det om man har en lång rad med olika varianter av
utfallsmåttet och genomför multipla signifikans-test: till slut får man ett signifikant resultat. Därför är
det viktigt att man bestämt sig för ETT utfallsmått, som utgör det primära utfallsmåttet. Det är mot
detta utfall – och BARA mot detta utfall – som signifikansprövningen ska göras. Sekundära utfallsmått
(om man tydligt markerar att de är just sekundära) kan vara värdefulla för att explorera resultaten så
att man kan formulera nya hypoteser, som sedan får prövas i en NY studie. Men att låtsas som de var
primära utfallsmått är på gränsen till forskningsfusk. För att få RCTs publicerade i välrenommerade
tidskrifter krävs nuförtiden att undersökarna redan före studiens igångsättande publicerat studieprotokollet eller en synopsis på publika webb-sidor (t.ex.ClinicalTrials.gov (http://clinicaltrials.gov/)
26
eller http://www.controlled-trials.com/). Där måste man också ange vad som är primär utfallsvariabel. En kontroll på dessa webbsidor anbefalls varmt som en rutinåtgärd.
”Intention-to-treat” (ITT)-analys och ”per protocol-analys”
Som nämnts inledningsvis är randomisering det enda sättet som finns för att eliminera all tänkbar
confounding, även sådan confounding som man inte känner till eller ens misstänker. Det beror på att
det inte kan uppstå några samband mellan behandlingen och förväxlingsfaktorer som påverkar
utfallsmåttet. Men denna fullständiga elimination av confounding kan bara ske om randomiseringen
gått rätt till, och om randomiseringsresultatet lämnats intakt. Som vi redan konstaterat kan det
uppstå selektionsbias (som yttrar sig som positiva eller negativa samband mellan behandlingen och
förväxlingsfaktorer som påverkar sannolikheten för utfallet) om man efter randomiseringen börjar
exkludera deltagare, eller om deltagare själva lämnar studien. Då kan man plötsligt ha fått problem
med confounding, trots att det är en randomiserad studie.
Därför är man överens om att huvud-analysen ska inkludera ALLA som randomiserats, även dem som
senare exkluderats eller fallit bort. En sådan analys kallas ”Intention-to-treat”-analys eller ITT-analys.
Det är BARA om randomiseringsutfallet lämnats intakt (och randomiseringen gått rätt till) som man
kan vara säker på att det inte finns någon confounding. Det anses vara en svår brist om inte ITT-data
presenteras som huvudresultat. Vid en ITT-analys måste man emellertid ofta göra antaganden om
hur det gått för dem som fallit bort. Det kan göras på olika sätt. Om deltagarna haft upprepade
kontakter med undersökarna under uppföljningen är ett sätt att anta att det slutliga utfallet blev
detsamma som när man sist såg deltagaren i studien. Det kallas för ”last observation carried
forward” (LOCF). Ett annat och mer konservativt sätt är att anta att alla som inte fullföljt studien INTE
blivit förbättrade (”worst-case scenario”). Idag använder man företrädesvis någon av de många
statistiska imputeringsmetoder, där man använder data från andra fullföljande deltagare som så
mycket som möjligt ”liknar” den deltagare som fallit bort. Bäst är förstås att minimera bortfallet.
”Motsatsen” till ITT-analys är ”per protocol”-analys. Då analyseras bara de deltagare som faktiskt
genomgått hela interventionen och uppföljningen. Sådana analyser är värdefulla som supplementära
analyser eftersom man då inte behöver göra antaganden om utfallet, men man måste vara medveten
om att confounding inte längre är utesluten.
Bedömning av statistiskt underlag/precision
För att välja ett lagom antal deltagare i studien (”urvalsstorleksberäkning”) måste undersökarna först
bestämma sig för vilken risk man är villig att ta för att felaktigt ”acceptera” ett falskt positivt
resultat (dvs. risken för att felaktigt förkasta 0-hypotesen och få ett statistiskt signifikant resultat som
uppkommit bara på grund av slumpen när behandlingen i själva verket är overksam). Den risken
brukar vanligen sättas till 5% och brukar kallas signifikansnivån eller alfa. När du läser i artiklar att
undersökarna anser att resultatet är statistiskt signifikant (och förkastar 0-hypotesen) därför att
p<0.05 så har de applicerat signifikansnivån 5%. På föregående sida kunde du läsa om implikationerna av signifikansnivån och p-värdet. Sedan måste undersökarna bestämma sig för den minsta
effekt som de vill kunna säkerställa (den minsta effekt som är så viktig att den inte får missas). Om
effekten är pytteliten är den sannolikt inte kliniskt relevant, men när man sedan rör sig uppåt på
skalan kommer man till en punkt där effekten blir kliniskt betydelsefull. När man väl har bestämt sig
för denna punkt (eller effektstorlek) måste man bestämma sig vilken risk man är beredd att ta för
att felaktigt ”acceptera” ett falskt negativt resultat (dvs. risken för att inte kunna förkasta 027
hypotesen och därmed få ett statistiskt icke-signifikant resultat när behandlingen i själva verket är
verksam – alltså risken att ”missa” effekten). Den risken (som brukar kallas beta2) sätts vanligtvis till
20% (eller mer ovanligt till 10%). Om en behandling faktiskt har en kliniskt relevant effekt (0hypotesen är i verkligheten falsk) och du gör om samma studie med beta=20% 100 gånger kommer
studien att ge ett falskt icke-signifikant resultat 20 gånger. Anledningen till att man inte väljer
beta=5%, precis som alfa, är att det behövs en kolossalt stor studie för att driva ned beta till så låga
nivåer – försåvitt man inte har en jättestor effekt av behandlingen, eller har satt alfa till betydligt
högre än 5%. Storleken på beta är nämligen beroende av 1) urvalsstorlek – ju fler deltagare ju lägre
beta; 2) effektstorlek – ju större effekt ju lägre beta; och 3) signifikansnivå – ju högre alfa, ju lägre
beta.
Baserat på dessa beslut kan statistikern räkna ut hur många deltagare som krävs. Som läsare av
studien måste du ta ställning till de underliggande besluten: Var övervägandena och beräkningarna
till grund för val av urvalsstorlek tydligt beskrivna? Var den minsta kliniskt relevanta effekten
förhandsdefinierad och var nivån rimlig? Var valet av alfa rimligt? Var valet av beta rimligt?
Om studien kommit till ett icke-signifikant resultat kan man inte utan vidare säga att det inte finns
någon effekt. Innan undersökarna kan dra en sådan slutsats måste de ange hur stor risken är för att
det är ett falskt negativt resultat och att de i själva verket missat en kliniskt viktig effekt. Om studien
är gravt underdimensionerad kan den risken vara väldigt stor. Om det inte finns någon urvalsstorleksberäkning med en redan specificerad beta/power, eller om undersökarna inte lyckades nå upp till det
antal deltagare som urvalsstorleksberäkningen föreskrev, måste de göra en s.k. post-hoc powerberäkning. Observera att en sådan beräkning inte behövs om resultatet var statistiskt signifikant. Då
kan man ju inte ha missat effekten.
Granskningsmallar
För att underlätta bedömningen av en studies kvalitet finns olika typer av granskningsmallar. De
hjälper dig att ställa de relevanta frågorna och att väga samman de olika kvalitetsaspekterna i ett
enda omdöme. På kurswebben finns en granskningsmall för behandlingsstudier (RCTs) som
ursprungligen utvecklats för SBU. Fördelen med den granskningsmallen är att den ”poängsätter” de
olika kvalitetsaspekterna så att de svåraste bristerna får en större vikt än de mindre betydelsefulla.
Mallarna finns i två versioner, en annoterad med diverse förklaringar (Kvalitetsgranskning av
vetenskapliga originalartiklar om behandling_v2.docx), och en kortare ”arbetsversion” utan
förklaringar (Kvalitetsgranskning av vetenskapliga originalartiklar om behandling_kort.docx). Den
kortare versionen finns som bilaga sist i detta dokument. I vår övning använder du denna
granskningsmall för att bedöma kvaliteten på de RCTs som kommit upp i sökningen.
Generellt är de aktuella studierna svaga. Det är oklart vilken typ av patienter som finns
representerade, och därmed blir den externa validiteten / generaliserbarheten oklar.
Randomiseringsprocessen är oftast dåligt beskriven, studierna är oblindade, compliance förefaller
överlag vara dålig, och bortfallet är stort (det är inga lätta studier att genomföra). Själva
studiedesignen är annars ganska okomplicerad och rapporterna ganska standardiserade och lättlästa.
Här följer en mer specificerad kritik, baserad på granskningsmallen:
2
Man brukar också tala om studiens ”power” att detektera en effekt. Power = 1 ̶ beta. Om beta är 20% (vilket
är detsamma som 0,2) blir power 0,8 eller 80%. Om beta är 10% blir power 90%.
28
Wolever et al: Tveksam extern validitet (poängsumma 9): Rekryteringsvägar ej beskrivna; hela flödet
från inbjudan inte beskriven enligt CONSORT; icke-deltagande redovisas inte. God intern validitet
(poängsumma 26): Ingen blindning av de som utvärderade effekten; bortfall på 19.8%. Adekvat
statistiskt underlag (poängsumma 6 av 7 möjliga).
Elhayany et al: Måttlig extern validitet (poängsumma 13): Stort ickedeltagande, oklara orsaker till
exklusioner. Undermålig intern validitet (poängsumma 4): Randomiseringen ej beskriven, men i en
annan publikation gällande samma studie (Fraser A, Abel R, Lawlor DA, Fraser D, Elhayany A. A
modified Mediterranean diet is associated with the greatest reduction in alanine aminotransferase
levels in obese type 2 diabetes patients: results of a quasi-randomized controlled trial. Diabetologia
2008;51:1616-22) framgår att det inte var någon riktig randomisering utan kvasi-randomisering
(alternerande sekvens, visserligen hanterad av en utomstående person); ingen blindning; ingen
tillfredsställande analys av följsamhet (bara E% kolhydrat redovisat); mycket stort bortfall (31%);
ingen primär utfallsvariabel; per protocol-analys. Tveksamt statistiskt underlag (poängsumma 3):
Minsta kliniskt relevanta effekt ej definierad; ingen motivering till samplestorlek; ingen
powerberäkning.
Iqbal et al: Hög extern validitet (poängsumma 15): Rekryteringsvägar oklart beskrivna, dock.
Undermålig intern validitet (poängsumma 12): Randomiseringen bara delvis beskriven; väsentliga
obalanser i baslinjedata (ehuru justerade med multivariat modellering); ingen blindning; mycket dålig
compliance; bortfall 53% (sic!), olika i behandlingsarmarna (kan sägas utgöra tillräcklig orsak för att
förkasta denna studie); per protocol-analys. Tveksamt statistiskt underlag (poängsumma 4 av 7
möjliga).
Davis et al: Måttlig extern validitet (poängsumma 12): Artificiella rekryteringsvägar (handplockade
prevalenta fall? Annonsering); stort icke-deltagande. Något tveksam intern validitet (poängsumma
21): Bara delvis beskriven randomiseringsprocedur, går ej att utesluta att den kunnat manipuleras
eller förutsägas; måttlig obalans i behandlingsgrupperna, justerat med multivariat modellering; ingen
blindning; 19% bortfall. Adekvat statistiskt underlag (poängsumma 6 av 7 möjliga).
Larsen et al: Måttlig extern validitet (poängsumma 13): Artificiella rekryteringsvägar (handplockade
prevalenta fall? Annonsering); stort icke-deltagande. Något tveksam intern validitet (poängsumma
21): Dålig följsamhet med interventionerna; ingen riktig ITT-analys. Adekvat statistiskt underlag
(poängsumma 6 av 7 möjliga).
Guldbrand et al: Måttlig extern validitet (poängsumma 10): Rekryteringsvägar oklart beskrivna,
möjligen handplockade patienter; bristande definition av utfallet. Något tveksam intern validitet
(poängsumma 20): Bristfälligt beskriven och möjligen inadekvat randomiseringsmetod; obalanser i
behandlingsgrupperna; ingen blindning; inget prioritering bland 17 olika utfall. Otillräckligt statistiskt
underlag: Mista relevanta kliniska effekt ej definierad, ingen samplestorleksberäkning, ingen post hoc
powerberäkning.
Ett genomgående mönster är att man efter 3 månader ser en mer tydlig effekt av låg-kolhydratkost
än av låg-fettkost vad avser viktnedgång och HbA1C, men att denna skillnad inte består, och att
skillnaderna är i stort sett obefintliga vid 12 månader.
29
Vilken är din slutsats?:
De fyra starkaste studierna (Wolever, Davis, Larsen och Guldbrand) samt den undermåliga Iqbal visar
samstämmiga resultat – ingen skillnad i effekt på vikt eller HBA1C efter ett år, men Davis (enbart) visar
förhöjt HDL kolesterol i låg-kolhydratgruppen. Elhayany visar bättre viktminskning, bättre HbA1C,
bättre HDL kolesterol, bättre triglycerider i låg-kolhydratdiet-armen. Ska det sammanvägda
evidensläget beskrivas som otillräckligt pga motstridiga resultat, eller ska man bortse från Elhayany’s
studie pga den dåliga interna validiteten, och säga att det finns måttligt starkt evidens (4 RCT:s, alla
med kvalitetsbrister) för att det efter 1 års dietbehandling inte föreligger någon skillnad mellan lågkolhydratdiet och låg-fettdiet vad avser viktnedgång och glycemisk kontroll? Jag lutar åt det
sistnämnda. När det gäller lipidförändringar är resultaten motstridiga och det måste sägas föreligga
otillräcklig evidens för några skillnader därvidlag mellan de två jämförda dieterna.
APPENDIX: Granskningsmall
Kvalitetsbedömning av randomiserade kontrollerade prövningar (RCTs)
1. Bedömning av extern validitet
Personer som uppfyller inklusionskriterierna benämns här "valbara".
a) Är inklusionskriterierna tydliga och acceptabla (kan man utläsa vilket medicinskt tillstånd
deltagarna egentligen har, och är definitionen förenlig med gällande kunskapsläge) ?
 Ja ( = 2)
 Nej (= 0)
b) Är valbara personer representativa för den målgrupp till vilken författarna vill generalisera sina
resultat?
 Ja, troligen (rekryteringsvägarna är väl beskrivna och förenliga med den kliniska verkligheten
– vanligen uppnås detta genom att konsekutiva* nya patienter tillfrågas. Vid interventionsstudier bland icke-patienter – urvalet är hyggligt representativt för målgruppen) (= 2)
 Går inte att säga (rekryteringsvägarna oklart beskrivna) (= 0)
 Troligen inte (rekryteringsvägarna är beskrivna, men situationen är artificiell – t.ex.
”handplockade” redan kända patienter [prevalenta fall], eller patienter rekryterade via
annonser) (= 0)
*) Med konsekutiva menas att alla nya valbara patienter som kommer till kliniken/mottagningen tillfrågas och
tas in i studien i den ordning som de kommit.
c) Redovisas hela flödet från inbjudan (enrollment) till randomisering, med alla exklusioner och
orsaker därtill, enligt CONSORT (se www.consort-statement.org)?
 Ja (= 2)
 Nej, men motsvarande information finns i texten (= 2)
 Nej, och motsvarande information ges ej (= 0)
30
d) Är icke-deltagande av så stor magnitud och sådan karaktär att det finns anledning att tro att
generaliserbarheten påverkas?
 Nej (= 2)
 Går inte att säga därför att icke-deltagande inte redovisas (= 0)
 Ja (= 0)
e) Är exklusionskriterierna tydliga och acceptabla?
 Ja (= 2)
 Nej (= 0)
f) Har antal och orsaker angivits för exkluderade personer (alltså FÖRE randomisering och återigen
bäst beskrivet i ett flödesdiagram)?
 Ja (= 2)
 Nej (= 0)
g) Finns en acceptabel definition av utfallsmåttet?
 Ja (= 3)
 Nej (= 0)
h) Är utfallsmåttet kliniskt relevant?
 Ja (= 2)
 Relevansen diskutabel (= 0)
 Relevans obefintlig  undersökningen bedöms sakna informationsvärde.
Om det finns åtminstone någon relevans i utfallsmåttet och den sammanlagda poängen är 14 eller
högre är den externa validiteten hög, om poängen är 10-13 är den externa validiteten måttlig, är
poängen 7-9 är den externa validiteten tveksam, och om poängen är under 7 kan den externa
validiteten inte bedömas.
2. Bedömning av intern validitet
2.1 Tilldelning av intervention eller behandling
a) Är randomiseringsproceduren beskriven?
 Ja, i detalj (= 3)
 Ja, delvis (= 1)
 Nej (= 0)
Om du inte svarat ”Nej” besvara även fråga b och c, hoppa annars till fråga d.
b) Kan det ha varit möjligt att manipulera randomiseringen?
 Nej (t ex ogenomskinliga kuvert, datorgenererad sekvens som finns hos någon annan än
prövningspersonalen) (= 1)
 Ja (t ex om metoden är slantsingling eller tärningskast, eller öppen randomiseringslista som
gör det möjligt att veta vilken betingelse som närmast i tur) (= 0)
31
c)
Medförde randomiseringen en oförutsägbar helt slumpmässig allokering (dvs fördelning av
deltagarna) mellan prövningsgrupperna?
 Ja (= 1)
 Nej (= 0)
d) Exkluderades patienter efter randomisering men före intervention?
 Nej, inte alls (= 3)
 Ja, men så få att det rimligen inte kunnat påverka resultaten (= 1)
 Ja, så många att resultaten potentiellt skulle kunna påverkas (= 0)
2.2 Gruppernas jämförbarhet
a) Finns en redogörelse för jämförbarheten mellan grupperna med avseende på kända faktorer som
kan tänkas inverka på resultatet (vanligtvis utgör detta Tabell 1 i en RCT)?
 Ja (= 1)
 Nej (= 0)
b) Förelåg några väsentliga brister i jämförbarheten, dvs. gruppskillnader (obalanser) i baslinjedata?
 Nej (= 1)
 Ja (= 0)
2.3 Blindning (maskering)
a) Gjordes försök till blindning, dvs. att maskera i vilken grupp försöksdeltagarna hamnade?
 Nej (= öppen prövning) (= 0)
 Enkelblind – de observatörer som utvärderade utfallet var blindade (= 2)
 Dubbelblind – både deltagarna och observatörerna var blindade (= 3)
 Trippelblind (dubbelblind + all resultatbearbetning utfördes innan prövningskoden bröts) (=4)
2.4 Följsamhet med given behandling (compliance)
a) Finns någon redogörelse för följsamhetens omfattning?
 Ja (= 1)
 Nej (= 0) Gå vidare till fråga 2.5
b) Var andelen med fullständig behandling acceptabelt* stor?
 Ja (= 2)
 Nej (= 0)
*Acceptabelt kan t ex vara att >80% av deltagarna fick >80% av den föreskrivna totaldosen.
2.5 Bortfall (antalet deltagare som inte har följts upp enligt studieprotokollet)
a) Finns en redogörelse för bortfallet samt uppgifter om orsakerna till detta?
 Ja (= 3)
 Nej (= 0) Gå vidare till fråga 2.6
32
b) Hur stor är risken att bortfallet kan ha snedvridit resultaten?
 Liten (exempelvis bortfall <10 %) (= 3)
 Medel (exempelvis bortfall 10-19 %) (= 2)
 Stor (exempelvis bortfall 20-29 %) (= 0)
 Mycket stor (exempelvis bortfall ≥30 %)  undersökningen bedöms ofta sakna
informationsvärde vilket kan innebära exklusion från evidensbedömning
2.6 Bedömning av biverkningar
a) Vidtogs acceptabla åtgärder för att samla in och registrera information om biverkningar?
 Ja, systematisk insamling och rapportering (= 2)
 Ja, begränsad beskrivning av inträffade biverkningar (= 1)
 Nej (= 0)
2.7 Analys av resultat
a) Var det huvudsakliga (primära) utfallsmåttet (resultatvariabel och mätmetod) definierat i
artikeln?
 Ja (= 1)
 Nej (= 0)
b) Var konklusionen angående studiens resultat baserad på detta utfallsmått (enligt a ovan)?
 Ja (= 1)
 Nej (= 0)
c)
Fanns en angiven förhandshypotes? (Varför skulle just denna behandling vara effektiv?)
 Ja (= 1)
 Nej (= 0)
d) Var sekundära utfallsmått definierade i artikeln?
 Ja (= 1)
 Nej (= 0)
e) Inkluderades data från alla randomiserade deltagare i analysen, och behölls de då i den
behandlingsgrupp som de från början allokerats till (intention-to-treat-analys, ITT)?
 Ja (= 4)
 Nej, man redovisar bara en ”per protocol”-analys eller motsvarande (= 0)
Max-poängen för intern validitet är 33. Om den sammanlagda poängen för intern validitet är över 28
måste studien anses ha utmärkt intern validitet. Om poängen är 25-28 kan den interna validiteten
sägas vara god. Om poängen är 20-24 kan den interna validiteten sägas vara något tveksam. Om
poängen är 15-19 är den interna validiteten bristfällig. Om poängen är under 15 är den interna
validiteten sannolikt undermålig och man bör överväga om man överhuvudtaget ska beakta dess
resultat.
33
3. Bedömning av statistiskt underlag / precision
3.1 Minsta kliniskt relevanta effekt
a) Var den minsta kliniskt relevanta effekten förhandsdefinierad?
 Ja (= 1)
 Nej (= 0)
b) Är den valda minsta kliniska relevanta effekten av rimlig storlek?
 Ja (= 1)
 Nej (eller ej angiven) (= 0)
3.2 Undersökningens statistiska styrka
a) Är överväganden och beräkningar till grund för val av urvalsstorlek (”sample size”) tydligt
beskrivna?
 Ja (= 2)
 Nej (= 0)
b) Hur stor var studiens ”power” (styrka) att påvisa den minsta kliniskt relevanta effekten?
 Power-beräkning är irrelevant eftersom det fanns en statistiskt signifikant effekt (=3)
 Power >90% (= 3)
 Power 80-89% (= 2)
 Power 70-79% (= 1)
 Power <70% (= 0)
 Power ej angiven trots icke-signifikant resultat (= 0)
Totalpoäng >4: Adekvat statistiskt underlag; 2-4 tveksamt statistiskt underlag; 0-1 otillräckligt
statistiskt underlag
34