Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Linköpings universitet
Lärarprogrammet
Dualiteternas förbannelse
En översikt över evidensproblematiserande litteratur och dess implikationer för
utbildningsområdet
Peter Ivarsson
Examensarbete inom
Samhällskunskap, forskningskonsumtion
Handledare:
Lars Niklasson
LIU-IEI-FIL-G--ÅR/xx--SE
Institutionen för ekonomisk och industriell utveckling – IEI
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Sammanfattning
Föreliggande uppsats behandlar debatten om hur den svenska skolan ska evidensbaseras på bästa
sätt. Olika former av evidensdefinitioners lämplighet för tillämpning inom utbildningsområdet utgör
således fokus i uppsatsen och undersöks med hjälp av två svenska tvärvetenskapliga antologier, en
svensk fenomenologisk doktorsavhandling samt en socialkonstruktionistisk vetenskapssociologisk
klassiker. Huvudsakligt fokus läggs på utrönandet av det så kallade Cochrane-formatets lämplighet.
Detta som en följd av att dess evidensdefinition förfäktas av OECD, en inflytelserik part i debatten,
och att det visat sig vara en populär evidensdefinition hos politiska makthavare, bl. a. i Danmark.
Utrönandet av Cochrane-formatets lämplighet för utbildningsområdet inleds genom en redogörelse
för hur Cochrane-formatet växt fram som ett svar på bristen på metodologisk stringens inom
sjukvården, en brist som äldre metoder, så som registerstudier och klinisk epidemiologi, visat sig
inkapabla att hantera. Därefter definieras särarten i Cochrane-formatets evidensdefinition;
randomiserade kliniska prövningar och metaanalyser och systematiska översikter av dessa. Dess
lämplighet undersöks sedermera utifrån tre lämplighetskategorier; ändamålsenlighet,
implementerbarhet och trovärdighet. Undersökningen visar på att betydande problematik föreligger
i relation till Cochrane-formatets lämplighet för det svenska utbildningsområdet. Detta främst som
en följd av dess reduktionistiska fokus på metodologisk stringens. Uppsatsen redogör för,och
problematiserar, efter detta den mångfald av alternativa evidensdefinitioner som uppstått som ett
svar på kraven på evidensbaserad praktik. Också denna mångfald av alternativ visar sig uppbära
betydande problem. Detta främst som en följd av dess ambivalenta fokus på praktisk relevans. Efter
detta undersöks litteraturens förslag på lösningar på Cochrane-formatets reduktionism och
ambivalensen i mångfalden av alternativa evidensdefinitioner, vilka visar sig landa i en uppfattning
om att problemet ska lösas genom en balansakt mellan metodologisk stringens och praktisk relevans
genom modiferade varianter av critical appraisal som möjliggör ett beaktande av för- och nackdelar i
den professionella praktiken. I undersökningens sista del undersöks möjligheterna till en sådan
balansakt genom beaktandet av forskning kring den sociala konstruktionen av vetenskapliga
forskningsresultat. Ur detta framgår att såväl tydliga evidensdefinitioner som balansakter kan vara
inkapabla att frammana objektiva utbildningsvetenskapliga faktum. Slutligen diskuteras rimligheten i
litteraturens resonemang och följderna av dess begränsningar. Utifrån detta framstår själva idén om
konkreta och enkla evidensdefinitioner som den faktor som förhindrar framväxten av den
evidensbaserade skolan. Utifrån detta landar uppsatsen slutligen i en slutsats om att det finns ett
behov av blocköverskridande politisk enighet i relation till skolan samt tvärvetenskapliga samarbeten
mellan forskningsparadigm och yrkesverksamma lärare i syfte att utarbeta möjligheter för lärare att
evidensbasera sitt arbete utifrån dess kontextuella förutsättningar, oberoende av de ideologiska och
paradigmatiska maktförhållanden som råder.
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Innehållsförteckning
1. INLEDNING........................................................................................................................................... 4
2. BAKGRUND .......................................................................................................................................... 4
3. PROBLEMSTÄLLNING ........................................................................................................................... 8
4. SYFTE ................................................................................................................................................... 8
5. FRÅGESTÄLLNINGAR............................................................................................................................ 8
6. METOD................................................................................................................................................. 9
6.1 AVGRÄNSNINGAR ........................................................................................................................ 10
7. UNDERSÖKNING ................................................................................................................................ 11
7.1 Cochrane-formatets framväxt och definition.............................................................................. 11
7.1.1. Cochrane-formatets problemformulering........................................................................... 12
7.1.2 Från registerstudier till randomiserade kliniska prövningar ................................................ 12
7.1.3 Från klinisk epidemiologi till metaanalyser och systematiska översikter ............................ 14
7.2 Cochrane-formatets ändamålsenlighet, implementerbarhet och trovärdighet i relation till
utbildningsområdet utifrån svenska forskningsperspektiv ............................................................... 16
7.2.1 Cochrane-formatets ändamålsenlighet för utbildningsområdet ......................................... 16
7.2.2 Cochrane-formatets implementerbarhet inom utbildningsområdet .................................. 19
7.2.3 Cochrane-formatets trovärdighet i relation till utbildningsområdet ................................... 22
7.3 Önskvärt hanterande av mångfalden av alternativa evidensdefinitioner utifrån svenska
forskningsperspektiv ......................................................................................................................... 25
7.3.1 Hantering av alternativa evidenshierarkier genom modifierad critical appraisal ................ 26
7.3.2 Hantering av vidgade och breddade evidensdefinitioner genom modifierad critical
appraisal ........................................................................................................................................ 27
7.4 Rimligheten i antagandet om att objektiv evidens existerar utifrån socialkonstruktionistiska
forskningsperspektiv ......................................................................................................................... 29
7.4.1 Vetenskapliga studiers trovärdighet som evidens ............................................................... 30
7.4.2. Den sociala konstruktionen av framgångsrika vetenskapsparadigm .................................. 31
7.5.3. Forskningssammanställningars trovärdighet som evidens ................................................. 33
7.5.4 Följderna för strävandet efter objektiv vetenskap ............................................................... 36
8. DISKUSSION OCH SLUTSATS .............................................................................................................. 37
9. FORTSATT FORSKNING ...................................................................................................................... 39
10. KÄLLFÖRTECKNING .......................................................................................................................... 40
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
1. INLEDNING
I debatten om skolan har forskning fått en säregen roll. En podcast vid namn ”Det är lärarnas fel”
diskuterade nyligen tendensen hos såväl politiker som andra skolledare, att motivera åtgärder med
påståendet ”forskning säger”. Podcasten mynnar ut i ett konstaterande att detta uttryck sällan
hänger samman med faktisk vetenskaplig syntesbildning utan desto oftare med diskursiva bilder av
verkligheten som man försöker bekräfta i efterhand genom användande av vetenskapliga studier
som passar denna verklighetsbild (Det är lärarnas fel, 2014). Anledningen till att så är fallet har av bl.
a. Jan Björklund i riksdagens kammare den 15/1-2015, motiverats med att humanvetenskapliga fält
är forskningsfält med många diametralt motsatta perspektiv. Vid Gustav Fridolins fråga om
rimligheten i att Björklund bortsett från den omfattande mängd remissinstanser som gett förslaget
om betyg i årskurs 4 tummen ned, tog Björklund upp det faktuella påståendet som motargument.
Något som förefaller innebära att han anser att spelfältet är öppet för att som politiker godtyckligt
välja vilka vetenskapliga perspektiv man personligen finner mest rimliga (Svt Forum, 2015). En effekt
av legitimerandet av sådana dogmatiska slutledningar på basis av åsikter går att se i ett
meningsutbyte i Dagens nyheter (DN) om huruvida läraryrket bör grundas i evidenskonsumerande
tjänstemannaskap eller i evidensproducerande professionalitet. I meningsutbytet skildras tre åsikter
om hanterandet av utbildningsvetenskapens osäkra grunder som förefaller ha blivit förhärskande; En
lärare som argumenterar för att forskning måste bedrivas av eller i nära samarbete med lärare i den
praktiska verksamheten (Tväråna, 2015a samt Tväråna, 2015b), en akademiker som argumenterar
för att bara yrkesforskare är kapabla att frammana bra forskning (Alvesson, 2015) samt det nybildade
skolinstitutet som argumenterar för en kombination av bruk av systematiska översikter upprättade
av yrkesforskare och professionellt lärarinflytande över forskningsprocessen (Wallberg och Miljand,
2015).
Samtidigt som rena åsikter kommit att prägla den vetenskapliga debatten om skolan i Sverige så har
en stärkt anglosaxisk vetenskapsdiskurs´ forskningsfynd och teoretiska utgångspunkter kommit att
användas som verktyg för att legitimera den politiska maktens åsikter. Specifika former av kvantitativ
mätning av skolresultat har således kommit att spela en stor roll i debatten, däribland olika former av
internationella prov och forskningssammanställningar där i synnerhet PISA-undersökningen har
figurerat flitigt i den skolpolitiska retoriken på nationell nivå medan Hatties massiva metanalysöversikt har kommit att få stort genomslag inom kommunal skolpolitik (Nilholm, 2013). I samband
med att denna typ av forskning har fått stort politiskt genomslag så har idéer om så kallad
evidensbaserad praktik angetts som ett rationellt sätt att strukturera skolverksamheten, bl.a. i strikt
enlighet med den anglosaxiska vetenskapsdiskursens forskningsläge. Något som bl. a. föranlett fokus
på formativ bedömning i skolan. OECDs dotterorganisation CERI har aktivt pressat medlemsländer att
anamma det så kallade Cochrane-formatets strikta evidensdefinition, vilken beskrivs nedan, och i
Danmarks fall principiellt lyckats väl med detta för att sedan se det danska skolinstitutet falla till föga
för de danska skolforskarnas annorlunda syn på evidensbegreppet (Levinsson, s. 55 samt Sager och
Bohlin, 2011, s. 192f). Frågor har i detta väckts, dels kring implikationerna av att idéerna som
Cochrane-formatets evidenshierarki bygger på är resultatet av en övergripande positivistisk
evidensrörelses reduktionistiska strävanden efter universellt giltig kunskap på kvantitativ grund. Dels
kring implikationerna av att mångfalden av alternativa evidensdefinitioner istället förefaller delge
vaga och relativa svar på komplexa problem inom utbildningsområdet.
2. BAKGRUND
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Debatten om vad som utgör en lämplig evidensdefinition för utbildningsområdet förefaller bottna i
spänningsfältet mellan positivism respektive skepticism och relativism, diametralt motsatta
kunskapsteorier vilkas portalgestalter kan sägas vara Kurt Godel respektive David Hume och
Protagoras. Medan positivismen utgår ifrån att objektiv kunskap inte bara finns utan dessutom kan
generaliseras, så menar skepticismen och relativismen tvärtom att all kunskap är subjektiv och relativ
till olika kontexter (Lübcke, 2003, s. 241f, 440, 449, 467, 509f samt Hessler, 1992, 13-17). Dessa
kunskapsteorier har i sin tur kommit att aktualiseras genom framväxten av två separata
forskningstraditioner; kvantitativ och kvalitativ metod. Konflikter finns mellan traditionerna i relation
till huruvida kvantitativt uppmätta och/eller statistiskt säkerställda kausalsamband, vad jag väljer att
kalla reduktionistisk stringens, är definitionen av god vetenskap eller huruvida kvalitativ förståelse för
det kontextuella sammanhanget, vad jag väljer att kalla ambivalent relevans, är det. Debatten har
också kommit att tangera konflikten mellan naturvetenskapen, där kvantitativa metoder
framgångsrikt använts för att identifiera stringens mellan observationer, och samhällsvetenskapen
där i synnerhet sociologin i huvudsak använt sig av kvalitativ metod för att identifiera kontextuellt
relevanta förklaringsmodeller (Hessler, 1992, s. 53f samt Bohlin, 2011, s. 19ff).
Disciplinmässigt kan konstruktionismen sägas vara den mest relativistiska vetenskapsteoretiska
riktningen inom det kvalitativa forskningsparadigmet, något som förvisso ifrågasatts inom
konstruktionismen även i relation till den kontroversielle Bruno Latours vittgående teoribildning
(Schantz och Seidel, 2012, s. 106f, 123) men som rimligen bekräftas av konstruktionismens syn på
kunskap som konstruerad och relativ till olika kontexter (Månsson, 2007, s. 73-83, 213). Bl. a. fysikern
Alan Sokal och biologen Richard Dawkins har varit starka motståndare till konstruktionismens idéer.
Sokal manifesterade detta genom att få en påhittad konstruktionistisk forskningsartikel om
kvantgravitation publicerad i en ansedd konstruktionistisk tidsskrift vilken han sedermera kritiserade
för kriterielöshet. Dawkins har i sin tur drivit argumentet att förekomsten av vetenskapliga
produkter, t ex flygplan, är ett bevis för att det är möjligt att sätta upp vetenskapliga
forskningskriterier och därigenom producera objektivt existerande resultat av dessa (Schantz och
Seidel, 2012, s. 34, 34 fotnot, 106 samt Månsson, 2007, 215f). Kritiker på den kvalitativa sidan
förefaller ha funnit sitt främsta vapen i den socialkonstruktionistiska vetenskapssociologin och dess
synliggörande av naturvetenskapens dolda subjektivism, något som framgår av Latour och Wollgars
studie, vilken behandlas i detta arbete. I en svensk kontext delger Jan Björklunds medlöpare i
propagerandet för införandet av betyg i årskurs 4, läkarprofessorn Martin Ingvar, perspektiv på
detta. Detta tillsammans med förbundet Humanisternas ordförande Christer Sturmark och
filosofiprofessorn Åsa Wikforss, i en debattartikel i DN den 22/3-2015, där de tre vänder sig mot en
upplevt utbredd kunskapsrelativism inom akademin i relation till bl. a. pedagogik. I detta framställs i
synnerhet socialkonstruktionistiska perspektiv på naturvetenskap som ett problem som de menar i
förlängningen riskerar att upplösa fundamenten för god moral och kunskap i samhället. Relativismen
hos lärosätena menar de också innebär att grunden för legitimerandet av akademiska yrken urholkas
(Ingvar, Sturmark och Wikforss, 2015). Bruno Latour har intressant nog själv uttryckt en rädsla för
denna möjlighet, Han menar att klimatförnekare och konspirationsteoretiker kommit att använda
relativism och konstruktionism för att förfäkta verklighetsuppfattningar som är objektivt dåliga för
mänskligheten på ett oroväckande sätt (Schantz och Seidel, 2012, s. 127).
Medan de inslag av positivism och relativism som förekommer i den svenska skoldebatten har djupa
vetenskapsfilosofiska rötter, så har debatten mellan det kvantitativa och det kvalitativa
forskningsparadigmet kommit att aktualiseras av pragmatiska skäl i och med tillkomsten av så kallad
New public management (NPM). Detta i synnerhet i relation till vården och skolan. New public
management är namnet på moderna idéer om att effektiviteten i den skattefinansierade
offentligheten ska garanteras genom olika former av standardisering, utvärdering och kontroll. I
detta har dokumentation och så kallad evidensbaserad praktik setts som lösningar för att säkerställa
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
kontroll över den mänskliga faktorn. Något som också lett fram till formerandet och spridandet av så
kallad evidensbaserad medicin (Wennström, 2013, s. 11ff samt Bohlin, 2011, s. 14). Möjligheterna att
formalisera verksamheter i enlighet med NPM är avsevärt större genom bruk av kvantitativ metod.
Det är dock också rimligen som en följd av naturvetenskapens och det kvantitativa
forskningsparadigmets höga ställning i jämförelse med samhällsvetenskapen och det kvalitativa
forskningsparadigmet, som vi ser ökade drivkrafter, bl. a. pådrivet av organisationer som OECD, för
att få den svenska skolan att tillämpa den så kallade evidensrörelsens definition av evidensbaserad
praktik, vilken grundar sig i dessa paradigm.
Evidens som begrepp är i sin ursprungliga betydelse obestridliga bevis (Levinsson, 2013, s. 15). För
den så kallade evidensrörelsen, d.v.s. de intressenter som arbetar för att överföra den anglosaxiska
normen för evidensbaserad praktik till norden och kontinenten, är som framgår nedan idén om
obestridliga bevis tätt sammankopplad med kvantitativa forskningssammanställningar på
experimentell grund. Idén med den evidensbaserade praktiken, såsom evidensrörelsen tänkt sig
denna, är således att råda bot på det gap som föreligger mellan användningen av denna typ av
forskningsresultat och tillämpningen av dessa i praktisk verksamhet (Nilsen, 2014, s. 15). Idén har
intressant nog markanta likheter med den effektivitetsforskning som fick sin höjdpunkt i Sverige på
50- och 60-talen, och som då kom att få betydelse för utbildningsområdets strukturering.
Effektivitetsforskningen kom från USA, var en reaktion på den humanvetenskapliga
forskningstraditionens upplevda flummighet och delgav som lösning på skolans frågor formaliserade
program, manualer och modeller utifrån den positivistiska behaviorismens experimentella
forskningsresultat. Forskningen övergavs i Sverige till förmån för Donald Schöns idéer om
reflekterande praktiker; en modell där läraren sågs som aktivt deltagande i utforskandet av
fungerande metoder och tillvägagångssätt i skolan. Detta vid insikten om att effektivitetsforskningen
gav föga goda resultat och dessutom reducerade skolans komplexa verksamhetsområde till en arena
för teknisk rationalitet. Reflektionsrörelsen i kombination med Michael Polyanis idéer om lärares
tysta kunskaper bidrog således till att återigen temporärt skifta pendeln åt det kvalitativa hållet
(Levinsson, 2013, s. 19f).
Inom utbildningsområdet har inte bara frågan om olika former av evidensdefinitioners trovärdighet,
utan också olika former av evidensdefinitioners ändamålsenlighet och implementerbarhet kommit
att resultera i infekterade konflikter. Detta som en följd av de väsentligt åtskiljda formerna av
kunskapsdefinitioner som föreligger mellan anglosaxiska länder och andra länder i relation till
evidens (Sager och Bohlin, 2011, s. 197). Dessa disparata kunskapsideal, vilka i relation till
utbildningsområdet kan kategoriseras som anglosaxiska curriculumtraditioner och nordiska
didaktiktraditioner, har frammanat distinkt åtskiljda perspektiv på vad som är ändamålsenlig
vetenskap för skolan. Perspektiven skiljer sig teoretiskt åt som en följd av olika former av
skolsituationer. Medan USA har saknat en central läroplan och därför behövt att lägga stort fokus på
att genom nationella prov utvärdera olika delstaters konkreta ämneskunskaper, har det i exempelvis
Sveriges fall kunnat läggas betydligt mer fokus på den övergripande bildningen av eleven som
samhällsmedborgare och därmed också olika abstrakta, relativa värden (Levinsson, 2013, s. 20).
Utvecklingen av idéer om evidensbaserad utbildning sägs i sin tur ha sin grund i ett föredrag som
David Hargreaves höll år 1996 på Teacher Training Agency i London. Han menade i detta att
läraryrket i sin dåvarande form, inte var forskningsbaserat i och med att den pedagogiska forskningen
saknade kvalitet, relevans och var för fragmenterad för att ackumuleras på ett konstruktivt sätt.
Följden av detta menade Hargreaves hade blivit ett utbildningssystem där vanor och traditioner
snarare än vetenskap präglade verksamheten (Levinsson, 2013, s. 25). Flertalet initiativ har sedan
dess tagits i de anglosaxiska länderna för att etablera sätt att evidensbasera utbildningssystemen. I
Storbritannien bildades år 2000 organisationen Evidence for Policy and Practice Information
Coordination Centre (EPPI), i syfte att skapa systematiska översikter till utbildningsområdet. Parallellt
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
med bildandet av EPPI, initierades också programmen ”Best Practice Research Scholarship” och ”the
Teaching and Learning Research Programme” i syfte att öka användandet av forskning i brittiska
skolor. I USA upprättades år 2001 ”No Child Left Behind”-act vilken syftade till att ge delstaterna
ansvar för elevernas måluppfyllnad och att bl. a. undervisningen bedrevs på vetenskaplig grund. Året
därpå etablerades organisationen What Works Clearinghouse (WWC) i syfte att göra RCTer till norm
för undersökningar om effektiva metoder i utbildningssystemet (Levinsson, 2013, s. 25f). Brittiska
Campbell-samarbetet, en systerorganisation till det så kallade Cochrane-samarbetet, och WWC anses
ha varit drivande i att överföra EBMs typ av systematiska översikter till utbildningsområdet
(Levinsson, 2013, s. 29f). Centrum för utbildningsforskning och innovation (CERI), är en del av OECD
som varit drivande i denna utveckling. CERI är ett medlemsgrundat program för granskning och
identifiering av trender inom utbildningsområdet samt granskning av medlemsländers forskningsoch utvecklingssystem (FoU-system), i syfte att genom denna verksamhet värna om forskning och
innovation samt transparens och ömsesidiga påverkansmöjligheter mellan länder. FoUgranskningarna studerar olika länders kapacitet till insamling, utveckling och spridning av för
utbildningsområdet relevant kunskap till detta områdes yrkesverksamma. Föga förvånande menar
CERI att denna verksamhet fungerar dåligt i de flesta länder i och med en svag vetenskaplig grund.
USA och Storbritannien är undantaget denna bedömning och anses snarare normerande (Levinsson,
2013, s. 27f).
Ett belysande möte mellan det anglosaxiska och det skandinaviska perspektivet på utbildning ägde
sedermera rum på en konferens i Washington anordnad av CERI, år 2004. På konferensen uppstod en
hätsk debatt mellan den danska delegationen och amerikanska RCT-anhängare angående huruvida
evidensbegreppet bör vidgas eller ej. Den danska ståndpunkten att mer än RCTer är att betrakta som
evidens väckte här missnöje. I samband med mötet hade OECD efter en utvärdering av landets
utbildningsforskning utfärdat en rekommendation till Danmark om att skapa en organisation i stil
med amerikanska WWC eller brittiska EPPI, vilken är mer metodologiskt pluralistisk än WWC, och
som bl. a. inkluderat kvalitativa studier sammanställda genom nya former av metoder för skapandet
av systematiska översikter, såsom narrativ begreppsanalys och metaetnografi, samt systematiska
översikter tänkta att besvara de för RCTer svåra frågorna om vilken undervisningsmetod som
fungerar för vem och i vilket sammanhang. I dessa systematiska översikter har så kallade ”viewstudies” och experimentella studier kombinerats för att uppnå den önskade relevansen (Sager och
Bohlin, 2011, s. 191ff samt Levinsson, 2013, s. 31). I CERIs expertgrupp satt vid tillfället för
granskningen av Danmark, David Hargreaves, vilkas uppfattningar om utbildningsområdets
vetenskapliga status behandlats ovan (Levinsson, 2013, s. 28).
Trots det motstånd inifrån utbildningsforskningen som visade sig på konferensen, och troligen som
en följd av CERIs hårda omdömen, valde de danska undervisnings- och vetenskapsdepartementen att
tillsammans med Danmarks Paedagogiske Universitet, utforma ”Dansk Clearinghouse for
Uddannelses-forskning” med tre förebilder som alla utgår från Cochrane-formatet; Cochranesamarbetet, Campbellsamarbetet och WWC (Sager och Bohlin, 2011, s. 192). De danska
utbildningsforskarna var mycket kritiska, bl. a. som en följd av upplevelsen att Cochrane-formatet
inte var förenligt med de traditionella verksamhetstyper som redan etablerats, d.v.s.
processutvärdering i syfte att förbättra/vidareutveckla pedagogiska grepp parallellt med att dessa
används. Resultatet av detta har blivit att kriterierna för de systematiska översikter som skulle vara
ledande för arbetet i skolverksamheten, breddats till att innefatta kvantitativa och kvalitativa
primärstudier och flera former av syntetisering (Sager och Bohlin, 2011, s. 192f). I Danmark har alltså
etablerandet av evidensbaserad praktik skett genom institutionell press för att sedan nyanseras i
praktiken och anpassas till de nationella traditionerna och intressekonflikterna (Sager och Bohlin,
2011, s. 193ff). En breddning som sedermera ägt rum inom flera verksamhetsområden (Levinsson,
2013, s. 31) och resulterat i en betydande mångfald av alternativa evidensdefinitioner.
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
I Sverige har utvecklingen varit mer subtil och grundad i implikationer om behovet av införandet av
evidensbaserad praktik inom utbildningsområdet. Problematiska resultat i tester avsedda för
kvantitativa jämförelser i skolprestationer mellan länder, såsom TIMSS och PISA, har i kombination
med de ökade krav på effektivitet som New public management medfört (Skolverket 2013a, s. 148
samt Wennström, 2014, s. 11) skapat drivkrafter för att införa vetenskapliga principer som enligt
världsomspännande organisationer håller hög kvalité. Införandet av formativ bedömning på bred
basis har exempelvis sin grund i systematiska översikter rekommenderade av OECD i egenskap av
stora uppmätta effektstorlekar (Levinsson, 2013, s. 16f samt 35). Utifrån detta förefaller det tydligt
att det är Sveriges tur att möta trycket från evidensrörelsen om att införa Cochrane-formatet i svensk
skola.
3. PROBLEMSTÄLLNING
I tider då skolan på ett synligt sätt förväntas befinna sig i vetenskapens verifierade frontlinjer är det
problematiskt att det inom utbildningsvetenskapen råder konflikter om på vilka grunder
avanceringen fram till denna frontlinje ska äga rum. Anledningen till att detta är ett problem är
tredelad. Dels öppnar det upp för att ideologiska ståndpunkter och paradigmatisk makt ersätter
objektiva vetenskapsideal. Dels urholkar det läraryrkets kapacitet till anspråk på objektiv
vetenskaplighet och därmed också dess status som profession. Dels blir det också svårt att avgöra
huruvida maktbalansen inom forskningsfältet eller den enskilde lärarens professionella bedömning
ska vara normerande för vilken typ av evidens som tillämpas i praktiken. Om läraren förväntas utföra
sitt praktiska arbete i enlighet med Skollagens proklamation att ”Utbildningen ska vila på
vetenskaplig grund och beprövad erfarenhet (Skollagen, 2010, kap 1, §5) så krävs det rimligen att den
vetenskapliga grunden är stabil. Och inte bara stabil utan också uppbärandes en vetenskap som är
trovärdig och implementerbar och som ger önskvärda, ändamålsenliga resultat. I detta uppstår
frågan hur ändamålsenligt, implementerbart och trovärdigt Cochrane-formatet är, som CERI i nuläget
aktivt försöker ge högt anseende också inom skandinavisk utbildningsvetenskap. Vidare frågor är hur
legitima argumenten mot denna lämplighet är liksom hur legitima förslagen på alternativa
evidensdefinitioner och balansakter är. Frågor vars svar bör vägleda en slutsats kring lärarens
lämpliga roll i relation till den evidens som ordineras uppifrån.
4. SYFTE
Syftet med denna uppsats har varit att utforska spänningsfältet mellan strikta och lösa
evidensdefinitioner i relation till deras respektive polers lämplighet för utbildningsområdet, samt
lämpliga sätt att hantera dessa spänningar och den pluralism av definitioner som uppstått som en
följd utav dem. Detta i ljuset av evidensdefinitionernas grund dels i olika syn på kunskap och dels i
olika kvantitativa och kvalitativa vetenskapsparadigm som konkurrerar med varandra om rätten att
få definiera fullgod evidens. Ambitionen har varit att utifrån denna undersökning få en bild av
huruvida det är lämpligt att se läraren som tjänsteman, tillika okritisk tillämpare av den
evidensdefinition som vunnit politikers och andra beslutsfattares gunst, eller som professionell
utrönare av olika evidensdefinitioners ändamålsenlighet, implementerbarhet och trovärdighet i
relation till olika uppgifter i skolverksamheten.
5. FRÅGESTÄLLNINGAR
1. Hur har Cochrane-formatet växt fram och vad är dess definition?
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
2. Hur ändamålsenligt, implementerbart och trovärdigt är Cochrane-formatet i relation till
utbildningsområdet utifrån svenska forskningsperspektiv?
3. Hur ska mångfalden av alternativa evidensdefinitioner som uppstått hanteras utifrån svenska
forskningsperspektiv
4. Hur rimligt är antagandet om att objektiv evidens existerar utifrån socialkonstruktionistiska
forskningsperspektiv?
6. METOD
Vid utformandet av mina forskningsfrågor och vid urvalet av litteratur utgick jag från hypotesen att
förutsättningarna för evidensbaserad praktik i svensk skola är oklart definierade och därför behöver
utrönas. Utifrån detta har jag letat efter litteratur som uppburit relevans dels för ämnet
evidensbaserad praktik och dels för den svenska skolkontexten. Jag har också funnit det relevant att
finna litteratur som ger en övergripande bild av problemområdet då jag upplever det som ett område
som är komplext och som det således är svårt att dra slutsatser om utan att ha en ordentlig översikt
över dess särart och dess implikationer för den svenska skolan. Denna översiktliga förståelse försöker
jag således också etablera hos läsaren av detta arbete så att denne till fullo ska förstå den studerade
kontexten. Fyra böcker har utifrån detta blivit urvalet vilka behandlar såväl evidensbegreppets tillväxt
och nuvarande status, liksom resonemang och forskning som problematiserar det; två
tvärvetenskapliga svenska antologier, en fenomenologisk, svensk doktorsavhandling samt en
socialkonstruktionistisk vetenskapssociologisk klassiker. Magnus Levinssons fenomenologiska
doktorsavhandling har jag upptäckt är en källa till kunskap om evidens i Skolverkets publikationer. I
dessa förekommer också Morten Sager och Ingemar Bohlins antologi (Skolverket, 2013, s. 12 samt
Skolverket, 2014). De undersökta böckerna hittade jag dels genom användandet av sökord så som
”evidens” och ”evidensbaserad praktik” i Unisearch, och dels genom att direkta titlar av besläktad art
angetts i den litteratur jag tagit del av.
Läsningen av den svenska litteraturen har lett fram till att jag har identifierat Cochrane-formatet som
kärnan i den vetenskapliga grund som evidensrörelsen önskar föra över från medicinens område till
det skandinaviska utbildningsområdet. Som en följd av detta har jag försökt att med hjälp av
böckerna inringa innebörden av Cochrane-formatet samt vilken typ av kritik mot det som litteraturen
lyfter fram. Fynden utifrån detta har i sin tur resulterat i att jag funnit kritik som jag upplevt kunnat
delas in i tre lämplighetskategorier; ändamålsenlighet, implementerbarhet och trovärdighet. För att
nyansera arbetet har jag också valt att studera den svenska litteraturens beskrivningar av
mångfalden av alternativa evidensdefinitioner som uppstått, dess lämplighetsproblem samt
litteraturens förslag på slutgiltiga lösningar. Dessa tre böcker knyter i huvudsak an till
implementeringsforskning, ett statsvetenskapligt forskningsfält. Den fjärde boken jag valt att
använda är istället en vetenskapssociologisk klassiker som problematiserar huruvida strävandet efter
evidensbaserad praktik alls är ett realistiskt förehavande. Identifikationen av definitionen av bokens
särart har jag åstadkommit med hjälp av Per Månssons bok Moderna samhällsteorier. Att jag valt att
använda denna vetenskapssociologiska klassiker beror på att den möjliggör en logisk slutpunkt för
den övergripande röda tråden i detta arbete, vilken kan sägas behandla den balansgång mellan
positivism och relativism som präglar debatten om lämpliga evidensdefinitioner i relation till
utbildningsområdet, vilket framgått av bakgrunden. Läsaren är tänkt att tematiskt föras från
beskrivningen av Cochrane-formatets positivistiska logik, där metodologisk stringens står högt i kurs,
genom bevisen för denna logiks olämplighet för utbildningsområdet, fram till den pluralistiska vaghet
som uppstått i strävandet efter kontextuellt relevanta evidensdefinitioner för utbildningsområdet
och slutligen över i den socialkonstruktionistiska vetenskapssociologins relativistiska logik, där såväl
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
stringens som relevans ses som illusioner. Boken refereras av Claes-Fredrik Helgesson i dennes
kapitel i Sager och Bohlins antologi och uppbringar också likartade resonemang som förekommer i
dennes kapitel. Intressanta likheter har vid läsningen av boken också visat sig förekomma mellan de
metoder som i denna studerats och i synnerhet logiken bakom systematiska översikter, vilket
ytterliggare stärkt min uppfattning om dess relevans för problemområdet. Varken RCTer eller
systematiska översikter är dock metoder som beskrivs uttalat i boken p.g.a. dess ålder. Samtidigt
behandlar boken vetenskapliga studier och forskningssammanställningar i allmänhet och utgör
därför en möjlighet att få generella perspektiv på olika forskningsmetoders förmåga att frammana
objektiv evidens. I relation till denna bok har jag valt att översätta begreppen ”credibility” och
”statements” till ”trovärdighet” och ”påståenden” för att tydliggöra resonemangen. Jag reserverar
mig för att i synnerhet innebörden i begreppet ”credibility” kan bli lidande som en följd av detta i och
med den mångfald av betydelser som föreligger i det engelska språket.
För att förenkla för läsaren har jag valt att referera sammanhang där Cochrane-formatets
evidensdefinition omnämns som just ”Cochrane-formatet”, i enlighet med Levinssons benämning på
detta i sin doktorsavhandling (Levinsson, 2013, s. 29f). Detta trots att de olika författarna i
litteraturen har valt att kalla denna evidensdefinition för olika saker. Det jag avser med Cochraneformatet är de tre delar som litteraturen förefaller definiera som den evidensbaserade medicinens,
EBMs, guldstandarder; Randomiserade kliniska prövningar och metaanalyser och systematiska
översikter av dessa. Guldstandarder som utgör kärnan i den evidenshierarki som evidensrörelsen
försökt föra över till utbildningsområdet (Nilsen, 2014, s. 46, 228 samt Levinsson 29ff). I kapitel 3 i
Per Nilsens antologi presenterar denne en evidenshierarki som utgår från denna modell vilken kan
beskådas nedan.
6.1 AVGRÄNSNINGAR
Anledningen till mitt val av fokus grundar sig som ovan nämnts i huvudsak i min upplevelse av att det
är relevant att såväl jag själv som läsaren förstår logiken bakom Cochrane-formatets framväxt och
särart, dess brister och dess alternativ i relation till den svenska skolkontexten, innan slutsatser kan
dras om dess potentiella funktion för den svenska skolan. Denna upplevelse har medfört ett behov av
att låta omfattande och övergripande svensk litteratur utgöra källmaterial istället för enskilda
forskningsartiklar. Rent tids- och omfångsmässigt har jag inte upplevt att jag haft möjlighet att
kombinera detta strävande efter förståelse med redogörelser för hur dess tillämpningar i skolan fallit
ut internationellt, där sådana exempel finns att hämta. Som en följd av detta har fokus legat mindre
på konkreta implementeringsexempel och mer på en förståelse för formatets och dess alternativs
förutsättningar. Således bör min skildring av Cochrane-formatet, dess inre motsättningar och dess
alternativ, inte ses som representativ för en uttömmande beskrivning av Cochrane-formatets
lämplighet inom utbildningsområdet, utan snarare som en översikt över tvärvetenskapliga svenska,
respektive vetenskapssociologiska, perspektiv på detta, vilka förvisso till stor del bottnar i
internationella källor men ändå inte kan ses som uttömmande i kraft av det ovan nämnda. De
studerade perspektiven är också ensidigt kritiska till Cochrane-formatet. Anledningen till detta
hänger samman med att samhällsvetenskaplig forskning om ämnet till övervägande del antar ett
sådant kritiskt förhållningssätt, något som också Sager och Bohlin konstaterat (Sager och Bohlin,
2011, s. 15).
I förhållande till litteraturen har delar som varit perifera för frågeställningen sållats bort. Däribland
delar som behandlar implementeringen av olika former av evidens inom specifikt sjukvården, ett i
huvudsak naturvetenskapligt område där psykosociala faktorer, så som är centrala inom exempelvis
socialt arbete och utbildning, är underordnade medicinska sådana. I Sager och Bohlins antologi har
Sagers och Karin Fernlers respektive kapitel sållats bort av detta skäl. I Nilsens antologi har en större
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
mängd kapitel också sållats bort. Kapitel fyra till åtta behandlar implementeringsforskningens teori
och metod och har därför ansetts perifera för detta arbetes mer översiktliga fokus. Kapitel nio till tolv
i antologin behandlar samtliga sjukvårdsimplementering av olika former av evidens och har således
av skälen som angetts ovan sållats bort. Kapitel 15 behandlar slutligen utbildning av
restaurangpersonal utifrån odefinerad forskningsgrund, varför jag bedömt det vara oanvändbart för
att besvara min frågeställning.
Att så många kapitel faller bort ur antologierna är en följd av att Cochrane-formatet i huvudsak fått
genomslag inom just medicinens område i Sverige medan det i relation till utbildningsområdet och
besläktade
verksamhetsområden
ännu
förefaller
vara
sparsmakat
med
tydliga
implementeringsexempel. Levinssons avhandling och Bergmark och Lundströms kapitel i Sager och
Bohlins antologi behandlar dock konkreta sådana exempel, liksom i viss mån Skagerströms kapitel i
Nilsens antologi. Hansen och Riepens kapitel i Sager och Bohlins antologi bidrar också med exempel
på detta men utifrån en dansk kontext. Dessa delar av materialet bör därför ses som komplement till
de resonemang som den svenska litteraturen i övrigt för kring ämnet implementering. Med detta
sagt utesluts dock inte skildringen av Cochrane-formatet i relation till sjukvård och andra
naturvetenskapliga discipliner. Helgessons kapitel i Sager och Bohlins antologi liksom Bruno Latour
och Steven Wollgars klassiska laboratoriestudie används bl. a. för att få grepp om Cochraneformatets trovärdighet, vilken till skillnad från ändamålsenligheten och implementerbarheten är
oberoende av den vetenskapliga kontext som den yttrar sig i.
Avgränsningen sätter alltså Ceris förfäktande av Cochrane-formatet, och den behandlade
litteraturens förfäktande av alternativ till detta, i skottgluggen och möjliggör därmed en
avstampsmöjlighet för framtida, mer breddade studier om vilken typ av evidensdefinition som är
lämplig för utbildningsområdet i Sverige. Detta utifrån den grundläggande polemik mellan positivism
respektive skepticism och relativism som präglar evidensdebatten.
7. UNDERSÖKNING
7.1 Cochrane-formatets framväxt och definition
Med Cochraneformatet avses i detta arbete som ovan nämnts de guldstandarder som kommit att bli
norm inom evidensbaserad medicin (EBM) i Sverige; randomiserade kliniska prövningar och
metaanalyser och systematiska översikter av dessa. Per Nilsen har i sin antologi exemplifierat en
evidenshierarki i enlighet med denna modell (Nilsen, 2014, s. 47) vilken visas nedan.
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Figur 1 Exempel på Cochraneinfluerad evidenshierarki inom EBM (Nilsen, 2014, s. 47)
Nedan redogörs för den problemformulering som ligger bakom Cochrane-formatet, dess utveckling
över tid och dess nuvarande form. Cochrane-formatet är tänkt som ett recept för att skapa hård
vetenskap inom komplexa verksamhetsområden. För att förstå grunden för CERIs iver att införa
Cochrane-formatet inom utbildningsområdet, är det initialt nödvändigt att redogöra för det påfunna
problem som utformandet av Cochrane-formatet bottnar i.
7.1.1. Cochrane-formatets problemformulering
Läkaren Archie Cochrane fick som krigsfånge under andra världskriget arbeta som läkare. Vid
vårdandet av patienter i krigsfångenskapen tvingades Cochrane att bortse från många formaliserade
praktiker som inom reguljär medicin ansågs nödvändiga. Han upptäckte då att många av dessa
formaliserade praktiker saknade funktion i praktiken och att patienter som nekats viss behandling
således ändå klarade sig. Upptäckten föranledde att Cochrane efter kriget bedrev en regelrätt
undersökning under vilken han kom att finna att 95% av alla förespråkade åtgärder inom medicinen
saknade vetenskapligt underlag (Sager och Bohlin, 2011, s. 10). Cochrane skrev senare i livet en bok
vid namn ”Effectiveness and Efficiency” i vilken han menade att de fynd han gjort ställde krav på
rättvisare fördelning inom sjukvården på basis av vetenskapligt verifierade effekter. En slutsats som
är i enlighet med argumenten för New public management (Wennström, 2014, s. 12f). Året innan sin
död definierade också Cochrane två av EBMs kommande gold standards; Randomiserade kliniska
prövningar (RCTer) och metaanalyser, som det som borde normera denna fördelning. Han
motiverade det hela med de fynd som gjorts i en studie om graviditet utifrån dessa premisser.
Genom detta brukar Archie Cochrane ses som evidensrörelsens grundare (Levinsson, 2013, s. 23).
7.1.2 Från registerstudier till randomiserade kliniska prövningar
Innan tillkomsten av randomiserade kliniska prövningar ansågs registerstudier vara ett gångbart sätt
att säkerställa att klinisk praktik var vetenskapsgrundad. Registerstudier är en typ av statistisk
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
sannolikhetsforskning som tillkom som en följd av att läkaren John Wennberg på 1980-talet genom
sina efterforskningar upptäckte avsevärda variationer mellan olika vårdinrättningars kliniska praktik.
Initialt försökte man i USA råda bot på det av Wennberg påfunna problemet genom upprättandet av
nationella register där diagnoser, behandlingsmetod, eventuella komplikationer och
mortalitetsfrekvens kartlades. Utifrån dessa så kallade registerstudier (på engelska outcomes
research) kunde sedermera kliniska riktlinjer upprättas i relation till den statistiska sannolikhet för
olika utfall som registerstudier visade. Något som i sin tur öppnade upp för utkrävande av ansvar från
lokala praktiker (Nilsen, s. 23-27). Sverige hade år 2009 som en följd av denna utveckling 77
nationella kvalitetsregister av den här typen som förvaltades av Sveriges Kommuner och Landsting
(SKL) (Sager och Bohlin, 2011, s. 51).
En konflikt uppstod successivt mellan förespråkare för så kallade randomiserade kliniska prövningar,
ofta i litteraturen förkortade RCTer, och förespråkare för registerstudier. Konflikten handlade om
huruvida RCTer i kombination med praktikbunden så kallad Critical appraisal vilken behandlas nedan,
eller registerstudier gav högst nivå av extern validitet. Kritiken som riktats mot de upprättade
registerdatabaserna är i huvudsak omöjligheten att i dessa veta huruvida den korrekta variabeln,
d.v.s. själva behandlingen av patienten, haft ett direkt kausalsamband med variablerna
komplikationer och mortalitet. Registerstudier har i detta betydligt mindre metodologisk stringens än
RCTer. Bl. a Adam Taube, professor i medicinsk statistik har drivit denna kritik i Sverige (Sager och
Bohlin, 2011, s. 53). Uppkomsten av RCTer kan utifrån detta ses som ett svar på de så kallade
registerstudiernas oförmåga att identifiera direkta kausalsamband. Den så kallade
McMastergruppen, initierad av anställda på medicinska fakulteten på McMaster university, var en
central kraft i utformandet av EBM i enlighet med Archie Cochranes idéer kring detta. De drev liksom
Cochrane starkt tesen att RCTer bör vara vetenskapsnorm (Sager och bohlin, 2011, s. 39f samt Nilsen,
2014, s. 28f). McMaster-gruppens intresse för att snarare än att beakta laboratoriegrundad kunskap
eller registerbundna sannolikheter som pekade på potentiella kausalsamband, kartlägga direkta
kausalsamband, ledde fram till att RCTer, i enlighet med Archie Cochranes vilja, kom att bli deras
definition av evidensbegreppets ”golden standard”. En metod som sedermera kommit att bli
normerande för EBM i sin helhet (Nilsen, 2014, s. 29, 34 samt Sager och Bohlin, 2011, s. 14, 69f).
Randomiserade kliniska prövningar har fått sitt namn som en följd av att de slumpmässigt fördelar
testsubjekt mellan kontrollgrupp och experimentgrupp på ett sätt som eliminerar okända
störningsfaktorer. Idealt ska detta ske enligt den så kallade double eller triple blind-principen där
deltagare, utförare, och i det senare fallet också utvärderares, kännedom om grupptillhörighet och
experimentstruktur elimineras (Nilsen, 2014, s. 47). Experimentgruppen delges sedermera den typ av
läkemedel som ska evidensprövas medan kontrollgruppen gives placebo. Sedermera manipulerar
forskaren oberoende variabler som anses ha en kausal effekt på en beroende variabel, allt i syfte att
upptäcka tydliga kausalsamband i experimentsituationen (Nilsen, 2014, s. 46f).
RCTer präglas alltså av regelstyrt genomförande under mycket kontrollerade former (Sager och
Bohlin, 2011, s. 73) och har således hög intern validitet. Detta innebär att man under de ideala
förutsättningar man bygger upp i testsituationen kan vara nästan säker på de funna
kausalsambandens riktighet förutsatt att man bortser från de socialkonstruktionistiska invändningar
som behandlas nedan. I nuläget finns det fyra olika nivåer av RCTer som utförs inom det medicinska
området, i litteraturen kallade ”faser”. Fas 1-RCTer utförs på friska personer, fas 2-RCTer utförs på
små patientgrupper, fas 3-RCTer utförs på stora patientgrupper och fas 4-RCTer utförs på mycket
omfattande patientgrupper i syfte att pröva redan etablerade läkemedels fortsatta lämplighet i
relation till effektivitet, bieffekter och mortalitetsfrekvens (Sager och Bohlin, 2011, s. 72).
Helgesson studerar i sitt kapitel i Sager och Bohlins antologi fas 4-RCTers trovärdighet, varför en
beskrivning av dessa är i sin ordning. Fas 4-RCTer äger inom medicinen rum på såväl ett geografiskt
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
som ett organisatoriskt utspritt sätt. De involverar således såväl olika testkliniker som specialiserade
kontor som arbetar med att kvantifiera inskickade resultatformulär utifrån en monitors granskningar
och andra funna diskrepanser. Kontakterna mellan dessa distanser administreras i sin tur genom
formella samordnings- och relationsregler som kan vara av generell eller studiespecifik art (Sager och
Bohlin, 2011, s. 72f). Olika kliniker rekryterar patienter och utför testerna under ledning av en så
kallad prövare, dvs en läkare som givits i uppdrag att överse administrationen av testen på plats.
Denna tar i sin tur hjälp av forskningssjuksköterskor och biomedicinska analytiker för att iscensätta
denna administrering. Insamlad data från testen samt enskilda patienters egenskaper och
förutsättningar journalförs och registreras sedan på specialutformade blanketter, så kallade case
report forms (CRF). Medan journalerna klassas som källdata och stannar på de testutfärdande
klinikerna så skickas CRFerna till särskilda databehandlingskontor för kvantitativ sammanställning.
Detta efter att dessa godkänts av en kontinuerligt utvärderande monitor. Monitorn i fråga är anställd
av en så kallad contract research-organisation (CRO), eller det läkemedelsbolag som driver
prövningen, och granskar korrelationsnivåer mellan CRFer och journaler, signaturer och att det råder
korrekt strukturering i relevanta pärmar. Monitorns granskning är tänkt att simulera en eventuell
myndighetsgranskning och är på så vis tänkt att säkerställa att testen håller för en eventuell sådan
prövning. Monitorn har dock inte befogenhet att själv rätta till felaktigheter utan arbetar istället med
att notera dessa, ställa frågor och uppmana till korrigeringar. Ett arbete som syftar till att underlätta
databehandlingskontorets sammanställningsarbete (Sager och Bohlin, 2011, s. 79f). Den ovan
nämnda blindningsprincipen får inte brytas förrän ”clean file” utropats. Principen kan dock också
brytas i nödfall, vid vilka det finns konkreta procedurer som måste genomföras för själva brytandet.
Clean file är en benämning på när forskningsresultat anses rena från oklarheter och diskrepanser och
således kan låsas, d.v.s. anses vara färdigbearbetade. Bearbetningsprocessen är i sig föremål för en
kontinuerlig avcheckning av korrelationerna och diskrepanserna mellan CRFer och journaler på de
olika nivåerna, något som Helgesson kallar datatvätt. Databehandlingskontoret kan i detta söka
klargöranden, bl. a. av oklara beskrivningar, bekräftelse på att uppgifter utanför de normala
gränsvärderna stämmer samt göra utredningar i sammanhang där uppgifter inte korrelerar mellan
journaler och CRFer (Sager och Bohlin, 2011, s. 80f).
7.1.3 Från klinisk epidemiologi till metaanalyser och systematiska översikter
Uppkomsten av metaanalyser och systematiska översikter kan i sin tur ses som ett svar på problemen
med så kallad klinisk epidemiologi, ett professionellt förhållningssätt som utgår från critical appraisal.
Idén om klinisk epidemiologi aktualiserades på 80-talet av John paul, ordförande för American
Society for Clinical Investigation, vid en medicinsk fakultet vid McMasteruniversitetet i Toronto
(Nilsen, 2014, s. 27f). På lärosätet innebar detta att den traditionella läkarutbildningen där läkarens
förtrogenhet med eminensbaserad laboratoriekunskap tidigare ansetts legitimera dennes
professionella bedömningar, byttes ut mot en utbildning där kompetens att inhämta och kritiskt
granska aktuell forskning om specifika kliniska problem sågs som primärt mål. För att utveckla denna
förmåga hos de blivande läkarna, kom utbildningarna att grundas i problembaserat lärande och
grupparbeten. Praktiken tänktes utifrån detta bedrivas i enlighet med stegen i modellen för Critical
appraisal (Bohlin, 2014, s. 28). Critical appraisal är en typ av professionellt utvecklingsarbete i
enlighet med en femstegsmodell för professionell praktik, där praktikern i en given verksamhet
kombinerar beaktande av evidens, kontextuell professionell bedömning och brukarens önskemål och
förutsättningar i syfte att intervenera i brukarens situation på ett för denne optimalt gynnsamt sätt.
Modellen ses som grundläggande för det paradigmskifte i början på 90-talet som kom att kallas EBM
(Levinsson, 2013, s. 24 samt Nilsen, 2014, s. 45). David Sackett, en av de mer framstående
arkitekterna bakom McMaster-gruppen delger i ett känt citat sin idealbild av hur praktikern i en
sådan uppstrukturerad verksamhet skulle vara en person som sysslade med:
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
”En noggrann, öppet redovisad och omdömesgill användning av den för tillfället bästa evidensen för
beslutsfattande om åtgärder (insatser, metoder) till enskilda personer, kompletterad med
professionell expertis och den berörda personens situation och önskemål” (Nilsen, 2014, s. 44).
Metodens fem ursprungliga steg är; formulerande av informationsbehov till frågor som kan besvaras,
uppletande av bästa tillgängliga kunskap utifrån behov och frågor, värderande av funnen befintlig
kunskap utifrån vetenskaplighet och praktisk användbarhet, integration av utvärderingen med
professionell bedömning och brukarens önskemål och förutsättningar, utvärdering av den
resulterande åtgärden samt effektiviteten i stegen ovan och strävanden efter förbättring utifrån
detta
(Nilsen,
2014,
s
45).
Förtroendet för critical appraisal har kommit att avta hos delar av evidensrörelsen i ljuset av insikter
om implementeringsproblemet med att lämna en sådan bedömningsprocess åt professionella
utövare inom varierande komplexa verksamhetsområden (Levinsson, 2013, s. 24).
Implementeringsforskning har pekat på att denna typ av förfarande är mycket svårt att
implementera i praktiken då komplexiteten i i synnerhet steg 2 och 3 tenderar att styra in den
professionelle på ett okritiskt evidenskonsumerande arbetssätt snarare än att uppmuntra denne till
självständig evidensbaserad praktik. Steg 4 anses också i och med sin vaghet kunna ta sig många olika
former hos olika praktiska utförare. En central variabel är den praktiska utförarens brist på tid och
kompetens att använda modellen (Nilsen, 2014, s. 45, 55f). Denna kritik kan i sig anses vara gällande
också för de tre förslag på modifikationer av critical appraisal som föreslagits då två utav dem ställer
krav på utförande av steg 2 medan alla tre kräver utförande av steg 4 (Nilsen, 2014, s. 46). I detta
uppstod i USA som en följd av behov av pålitligare ackumulation av information under kalla kriget,
således två ersättande, eller beroende på synsätt kompletterande, funktioner; Metaanalys och
systematiska översikter, som tillsammans med RCTer i nuläget anses vara evidensens tre grundpelare
inom EBM (Nilsen, 2014, s. 34, Sager och Bohlin, 2011, s. 14 samt Levinsson, 2013, s. 15f och 29).
Metaanalyser är statistiska sammanställningar av långa serier av studier, i Cochrane-formatets fall
sammanställningar av ett stort antal randomiserade kliniska prövningar av likartade variabler
(Levinsson, 2013, s. 15, Nilsen, 30fff). Metaanalysens födelse tillskrivs utbildningspsykologerna Gene
Glass och Mary Smith och tillkom som en metod för att kunna omvandla kvantitativa
forskningsresultat med spridda resultat till tydliga statistiska effektstorlekar. Glass och Smith
omvandlade på detta vis 400 studier om psykoterapi, respektive 80 studier om korrelationer mellan
klasstorlekar och elevprestationer, till metaanalyser (Nilsen, 2014, s. 30f samt Levinsson, 2013, s. 29).
Metanalysers styrka anses ligga i att de utöver att synliggöra effekter, också möjliggör jämförelser
mellan olika studiers utfall och därmed också statistiska sammanvägningar av uppmätt effekt
(Levinsson, 2013, s. 29). Den kritik som följde var trots detta i form av invändningar mot att
metaanalyser inte i tillräcklig utsträckning beaktar skillnader i variabelstruktur och kvalité mellan
studier, den så kallade ”äpplen och päron”-invändningen. ”Äpplen och päron”-invändningen
besvarades med argument om att allmänna kriterier bör gälla om att de studier som syntetiseras ska
uppbära tillräcklig likhet med varandra. En av forskarna i den så kallade Oxfordgruppen menade att
studier med fördel kan inkluderas i metaanalyser om de har en gemensam grund i att vara RCTer,
något som också kommit att bli norm för de studier som inkluderas i metaanalyser. Thomas Chalmers
med kollegor inom Oxfordgruppen, skapade sedermera vetenskapliga kriterier för skapandet av
metaanalyser för att säkerställa att dessa, liksom RCTer, kunde anses ha god trovärdighet och
metodologisk stringens (Nilsen, 2014, s. 31f).
Studier som delar relevans men som inte kan syntetiseras i metaanalyser, kunde i sin tur bli föremål
för systematiska översikter efter att tekniken för detta utvecklats på 90-talet. I systematiska
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
översikter används likartade kriterier som för metaanalyser i syfte att göra relevanta urval av
separata studier, kritiskt granska dessa samt analysera deras sammanvägda innebörd. Systematiska
översikter har kommit att bli en överordnad kategori där både metaanalyser och andra
sammanställningar förekommer (Levinsson, 2013, s. 15, 29 samt Nilsen, 2014, s. 33 och 36f samt
SBU, 2004). Systematiska översikter produceras inom utbildningsområdet i nuläget främst av olika
former av mäklarorganisationer som kan vara statliga eller intressedrivna (Levinsson, 2013, s. 16
samt 34). Proceduren för utarbetandet av systematiska översikter kan sägas utgöra en mer
formaliserad form av critical appraisal. Arbetet börjar med att forskningsfrågan formuleras utifrån
fastställda principer. Forskningsfrågan kan då exempelvis bli något i stil med; ”Vad är effekten av
intervention A på variabel 1 respektive variabel 2 inom populationen i kontext Z”. Forskaren utför
efter frågeformuleringen en omfattande sökning efter forskningsdata utifrån den
teoretiska/konceptuella utgångspunkt som föreligger som analytiskt och syntetiserande ramverk för
den specifika systematiska översiktens tillämpningsområde. Insamlad data granskas kritiskt utifrån
frågornas fokus och utifrån teoretisk/konceptuell utgångspunkt, och syntetiseras sedermera i för
ramverket rimligt format. De systematiska översikterna redovisas i såväl vetenskapligt som
verksamhetsunderlättande form genom två separata resultatredovisningar; en metod och teknikrapport och en tillämpningshandledning, där det tydligt ska framgå hur litteratursökning och kritisk
granskning har gått till. Arbetet med framställning av systematiska översikter monitoreras sedermera
med hjälp av granskningsprotokoll där tydliga riktlinjer utifrån principiellt ramverk kan leda arbetet i
rätt riktning (Levinsson, 2013, s. 33f)
7.2 Cochrane-formatets ändamålsenlighet, implementerbarhet och trovärdighet i
relation till utbildningsområdet utifrån svenska forskningsperspektiv
Nedan undersöks den svenska litteraturens syn på Cochraneformatets ändamålsenlighet,
implementerbarhet och trovärdighet i relation till utbildningsområdet. Med ändamålsenlighet avses
formatets förmåga att hantera bredden av mål och uppdrag som skolan har. Med
implementerbarhet avses formatets kapacitet att effektivt översättas till skolverksamhetens
praktiska sammanhang. Med trovärdighet avses formatets förmåga att ge säkra vetenskapliga
indikationer på problemlösning inom skolan.
7.2.1 Cochrane-formatets ändamålsenlighet för utbildningsområdet
Magnus Levinsson menar i sin avhandling att frågan om evidensbaserad praktik inom
utbildningsområdet behöver diskuteras och problematiseras utförligare (Levinsson, 2013, s. 110f).
Detta inte minst då det, som ovan nämnts innehåller spår av den tidigare effektivitetsforskningen
som antyder att dess nuvarande form kan vara trendartad (Levinsson, 2013, s. 19). Levinsson menar
att det finns en poäng med den kritik som inom aktionsforskningen lyfts om att idéerna om
evidensbaserad praktik riskerar att förvärra det distanserande från skolans verksamhet och den
marginalisering av lärarkårens betydelse och behov som präglat den pedagogiska forskningen under
80- och 90-talen. Påföljande återuppväckta konflikter mellan förespråkare för kvantitativ och
kvalitativ forskningsmetod, så som omnämnts ovan, menar Levinsson har ökat på denna
marginalisering och lämnat lärarna i en kluven position mellan professionalitet och
tjänstemannaskap (Levinsson, 2013, s. 17f samt 107).
Cochrane-formatet utgår vidare ifrån empirismen, d.v.s. att verkligheten definieras genom stringens
mellan upprepade sinnesobservationer. Här förväntas alltså verkligheten tala för sig själv och det
mänskliga subjektet hålla sig borta från att ge tolkningar utöver det som direkt observerats med
sinnesorganen. Per Nilsen tar i sin antologi upp att det i debatten kring den önskvärda relationen
mellan rationalism och empirism inom evidensbaserad praktik har påtalats att renodlad empirism i
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
form av RCTer som golden standard, kan förvanska laboratoriefynd och beprövad erfarenhet som
trots att de inte verifierats genom RCTer sammanställda i metaanalyser, ändå utifrån rationalistisk
synvinkel uppbär trovärdig ontologisk status (Nilsen, 2014, s. 49f). I detta ingår rimligen kunskap om
den kontextuella variation som är omöjlig att täcka upp i RCTer och som är vanligt förekommande i
skolmiljö. Levinsson konstaterar vidare att en praktisk utförare kan befinna sig i en kontext där en
metaanalytiskt verifierad och ordinerad åtgärd inte är ändamålsenlig och till och med kan vara direkt
skadlig för den aktuelle klient som åtgärden rent empiriskt anses kunna gagna (Levinsson, 2013, s.
101). Här menar den i debatten frekvent förekommande utbildningsforskaren Martyn Hammersley
enligt Levinsson att ändamålsenlig kvalitativ forskning riskerar att uteslutas ur evidensdefinitionen
som en följd av evidensrörelsens rigorösa krav på empirisk stringens (Levinsson, 2013, s. 60).
Martyn Hammersley menar vidare enligt Levinsson att evidensrörelsen genomsyras av ett
positivistiskt ideal som driver detta uteslutande av kvalitativ forskning (Levinsson, 2013, s. 60). Nilsen
tar i sin antologi i relation till detta upp att kritiska forskare ifrågasatt huruvida RCTer alls är kapabla
att ge relevanta svar på problem inom vissa verksamhetsområden. Detta i och med att RCTer utgår
ifrån en positivistisk naturvetenskaplig syn på forskning där subjekt kan reduceras till objekt i
kontrollerade miljöer (Nilsen, 2014, s. 51). Nilsen och Levinsson tar vidare upp att flera kritiker menar
att denna typ av reduktionism specifikt gör det svårt att besvara frågan om vad det är som fungerar i
och med att den praktiska kontextens variabler är svåra att kontrollera experimentellt. Med detta
avses den kvantitativa forskningens intresse för kausalsamband på bekostnad av förståelse för
orsakerna till kausalsamband, samt på bekostnad av kvalitativa variabler som är minst lika viktiga att
beakta. RCTer har utifrån detta resonemang för låg extern validitet för att dess resultat ska kunna
generaliseras på ett sätt som besvarar den för utbildningsområdet centrala frågan om vad som
fungerar för vem och i vilken kontext, eller för den delen den centrala frågan om om, och i så fall
vilken, funktion RCTer fyller i relation till påverkan. Nilsen och Levinsson menar att skolan dels har
många mål som är kopplade till egenskaper och förmågor som inte kan mätas experimentellt såväl
inom ämnen som inom värdegrundsarbetet. Utöver detta kan alternativ forskning, exempelvis
kvalitiativ sådan ses spela en stor roll för förmågan att identifiera problem och att i olika situationer
nyttja perspektivbyten (Nilsen, 2014, s. 51 samt Levinsson, 2013, s. 61f).
Frågan om RCTers ändamålsenlighet för psykosociala verksamhetsområden, exempelvis
utbildningsområdet, problematiseras vidare av Nilsen med hänvisning till en serie variabler som
RCTer är inkapabla att hantera. Här ingår utförareffekter, representativ urvalskvantitet och etiska
låsningar. Med utförareffekter avses de subjektiva påverkansvariabler som informellt har en del i den
vetenskapliga processen eller sker i samband med denna, något som behandlas mer utförligt i
relation Claes-Fredrik Helgessons, Bruno Latour och Steven Wollgars studier nedan. Med
representativ urvalskvantitet avser Nilsen det faktum att det inom psykosociala verksamheter, där
många variabler och stora variationer mellan individer, klasser och grupper förekommer, behövs ett
mycket stor urval ur populationen för att detta ska vara representativt för mångfalden av kontexter
och därmed generaliserbart på hela populationen. Han tar här också upp att ändamålsenliga RCTer
måste utföras i en realistisk experimentmiljö som beaktar den specifika kontextens förutsättningar i
form av resurser, organisering och kompetenser. RCT-miljöer är istället ofta idealiserade, dvs det
existerar inga störande externa faktorer i dem. Testsubjekten är dessutom ofta homogena och
selektivt utvalda för att optimera tydligheten i utfallen. RCTer av denna typ förutsätter att en
implementeringsarena finns där högmotiverade,kompetenta aktörer sjösätter interventionen i en
miljö av optimerad organisation och tillräckliga resurser (Nilsen, 2014, s. 51f). Nilsen tar i relation till
detta upp att det enligt kritiker föreligger ett så kallat ”ekologiskt felslut” i att låta aggregerade
studier av kontrollerad experimentell art vara generellt gällande trots att den praktiska verkligheten
präglas av individuella klienter med individuella behov (Nilsen, 2014, s. 54). RCT-förespråkares
antaganden om att en idealiserad implementeringsarena finns inom psykosociala
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
verksamhetsområden, och att det inte är nödvändigt att uppmärksamma diskrepansen mellan
generaliseringar och kontextuella variationer, bör ses som problematisk också i ljuset av Bergmark
och Lundströms resonemang kring klienternas motivation nedan. Den etiska låsningen som Nilsen
slutligen tar upp syftar på att det finns etiska problem med att i verksamheter som kräver
longituditionella studier för att kunna uppmäta effekt, förneka etablerade kontrollgrupper de
gynnsamma effekter som teoretiskt kommer utav de korrekta interventionerna i experimentgruppen
(Nilsen, 2014, s. 51f). Något som kanske i synnerhet är relevant i skolans fall där experiment skulle
kunna ha en direkt skadlig inverkan på slumpmässigt utvalda elevgrupper i en eventuell
kontrollgrupp. Att som forskare i skolan medvetet hindra lärare och elever från att uppnå de mål som
skolans verksamhet syftar till har i sig rimligen än mer tvivelaktiga etiska följder. Inte minst då
Skollagen klargör att yrkesverksamma i skolan utöver måluppfyllnad också förväntas följa etiska
riktlinjer kring elevernas måluppfyllnad (Skollagen, 2010, kap 3, §3).
Bergmark och Lundström driver i sitt kapitel i Sager och Bohlins antologi en kritisk tes i relation till
RCTers ändamålsenlighet för missbruksvård som uppbär relevans för dess applicering på psykosociala
verksamhetsområden i allmänhet. De menar att en betydande mängd studier visat att RCTer av
psykosociala och psykoterapeutiska interventioner i relation till missbruksbehandling, systematiskt
tenderar att drabbas av vad de kallar för ”drontens domslut”, efter en passage i Alice i underlandet
där dronten i egenskap av tävlingsdomare proklamerar att alla deltagare har vunnit tävlingen. Med
detta avses svårigheten att identifiera skillnader i effekt mellan olika behandlingsinterventioner
genom bruket av så kallade relativa RCTer, där effekterna av olika behandlingar och variabler har
undersökts (Sager och Bohlin, 2011, s. 177f). Drontens domslut är en titulering som Bergmark och
Lundström använder för att beskriva såväl situationen inom forskningen kring missbruksbehandling i
allmänhet liksom utfallet av ett mycket omfattande kliniskt forskningsprojekt inom psykologisk
missbruksvård; MATCH.
Ambitionen med MATCH var enligt Bergmark och Lundström att identifiera vilka klientegenskaper
och terapeutiska behandlingsmetoder som var mest gynnsamma att matcha. Detta strävade man
efter att åstadkomma genom användandet av just de relativa RCTer som omnämnts ovan, där
effekterna av olika matchningar skulle undersökas. Resultatet av projektet blev dock enligt Bergmark
och Lundström en besvikelse. Varken pålitliga matchningseffekter eller specifika mekanismer
identifierades av RCTerna, något som tillsammans med drontens domslut enligt Bergmark och
Lundström gör idén om upprättandet av riktlinjer i enlighet med så kallad best practice, där störst
effekt medför användande, irrationell (Sager och Bohlin, 2011, s. 178f). Bergmark och Lundström
menar att drontens domslut och utfallet av MATCH hänger samman med RCTers låga externa
validitet som omnämnts ovan. Medan det i testsituationen naturligt föreligger testsubjekt som
frivilligt deltar i behandlingen så menar de att missbruksvården istället ofta är inriktad mot
omotiverade och ibland också tvångsbehandlade klienter. Att istället bedriva RCTer på dessa grupper
menar Bergmark och Lundström är orimligt i och med att dessa då skulle behöva slumpmässigt
fördelas på exempelvis vårdinrättningar trots att ett sådant fördelande inte är hållbart ur etisk
synpunkt (Sager och Bohlin, 2011, s. 179f). De menar att situationen med att få RCTer finns bedrivna
på omotiverade klienter, att svårigheter finns med att uppnå dessa samt att en omfattande
förekomst av drontens domslut identifierats, gör det orimligt att anamma snäva evidenshierarkier så
som Cochrane-formatet inom psykosocial missbruksbehandling (Sager och Bohlin, 2011, s. 180).
Resonemanget är relaterbart till två av de aspekter av RCTers ändamålsenlighet för
utbildningsområdet som Nilsen och Levinsson omnämnt ovan. Dels genom det etiska problemet med
att experimentera med nya metoder på elever som har rätt till en likvärdig utbildning. Såväl
missbrukare som elever har rimligen rätt till en etiskt hållbar behandling. Dels genom orimligheten i
att applicera resultat från idealiserade frivilliga RCTer på ofrivilliga testsubjekt. Såväl
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
tvångsbehandlade missbrukare som skolpliktiga elever kan anses särskilja sig markant från de
frivilliga och motiverade testsubjekt som deltar i RCTer.
Argumenten för Cochrane-formatet utgår ifrån uppfattningen att det kvalitetssäkrande och den
utveckling av såväl metod som professionell förmåga som följer utav att arbeta utifrån systematiska
översikter av RCTer, bidrar till att legitimera professionen på ett sätt som gynnar dess utövare.
Motståndarna menar istället att denna typ av standardisering av den professionella praktiken leder
till detaljstyrning av den professionelles agerande som innebär en skadlig inskränkning i den
professionelles självständighet. Denna inskränkning ska enligt dessa innebära en reducering av den
professionelles förmåga till innovativt tänkande och kontextbundna bedömningar, och leder i
förlängningen till en form av forskningsanvändning som inte är gynnsam inom psykosociala
verksamhetsområden så som utbildningsområdet (Nilsen, 2014, s. 52f samt Levinsson, 2013, s. 60ff).
Nilsen påvisar vidare att en diskussion förts kring huruvida Cochrane-formatet och andra former av
kvantitativ evidens demokratiserar eller avdemokratiserar verksamheter. Evidensförespråkare menar
enligt Nilsen att bruket av korrekt utformade systematiska översikter stödjer professionella och
brukares integritet då auktoritets- och eminensstyrd praktik bannlyses. När så sker befrias dessa från
ovetenskapliga och verksamhetshämmande direktiv som hindrar professionen från legitimitet och
brukarna från en trygg och säker praktik (Nilsen, 2014 s. 53f). Kritiken mot denna argumentation
vänder enligt Nilsen på perspektiven och menar på att auktoritets- och eminensstyrd praktik i själva
verket främjas av bruket av kvantitativ evidens som dominerande kunskapskälla. Detta menar man
sker genom att den makt som professionella och brukare ändå haft att förhandla om
kunskapsanspråken utifrån det kontextuella sammanhanget, går förlorad när makt förskjuts till
beslutsfattare och myndigheter som anser det kontextuella sammanhanget vara sekundärt till
generella paketlösningar så som systematiska översikter (Nilsen, 2014, s. 54). Gert Biesta, en annan
framträdande utbildningsforskare, framhåller i enlighet med detta enligt Levinsson att kvantitativ
evidens är såväl odemokratisk som avprofessionaliserande (Levinsson, 2013, s. 62). Det tas också upp
här att de många sociala verksamhetsområden där brukarens önskemål anses viktiga, tappar
förmågan att tillfredsställa dessa önskemål om de också ska beakta kriterierna för evidensbaserad
praktik (Nilsen, 2014, s. 55). Med alltför stort resultatfokus riskeras det att kvalitativa värden som går
bortom vetenskapligt fokus på resultat går förlorade. På motsvarande sätt riskerar ett sådant fokus
att bortse från kvalitativa variabler som måste beaktas för att forskningen ska kunna anses praktiskt
relevant. I och med att utbildningsområdet genomsyras av sådana värden och variabler kan
Cochrane-formatet utifrån resonemangen ovan, ses som icke ändamålsenligt för detta.
7.2.2 Cochrane-formatets implementerbarhet inom utbildningsområdet
Nilsen påpekar i enlighet med de resonemang som delges ovan, att det finns betydande svårigheter
med att överföra idealiserade RCTer till utbildningsområdet på pålitliga sätt (Nilsen, 2014, s. 50f).
Levinsson menar också att många kritiker har lyft fram att det finns svaga belägg för att Cochranemodellen gett önskvärd effekt inom utbildningsområdet, men ändå uppvisar desto starkare
likgiltighet inför de implementeringsproblem som uppstått i relation till detta (Levinsson, 2013, s.
63). Bl. a. utbildningsforskaren Lejf Moos har enligt Levinsson menat att detta bottnar i den alltför
instrumentella syn på exempelvis klassrumspraktik så som beskrivits ovan (Levinsson, 2013, s. 61).
Ingemar Bohlin nämner också att liknande kritik mot Cochrane-formatet som Nilsen och Levinsson
tar upp, också lyfts inom läkarprofessionen; att det vetenskapsideal Cochrane-formatet framhäver
övervärderar RCTers interna validitet samtidigt som det underskattar värdet av den professionella
kompetens som krävs för att implementera vetenskapliga fynd på effektiva sätt i praktiken (Nilsen,
2014, s. 38).
Detta har i sig en effekt på den mänskliga faktorn, något som i synnerhet Levinsson fokuserat på i sin
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
avhandling. Här beaktas hur yrkesverksamma lärare känslomässigt reagerar på att få i uppdrag att
implementera forskning utifrån systematiska översikter i den praktiska verkligheten när den externa
validiteten i dessa visat sig bristfälliga (Levinsson, 2013, studie 1 o 3). Levinsson pekar i sin avhandling
på att så kallad research utilization-forskning, eller implementeringsforskning på svenska, har
upptäckt att ett antal mänskliga faktorer tenderar att i allmänhet försvåra implementering av
forskning inom utbildningsområdet. För det första har det faktum att forskningsresultat tenderar att
presenteras med ett abstrakt och teoretiskt språk, visat sig försvåra smidig forskningsläsning. För det
andra har lärare i sin utbildning fått för lite utbildning i hur forskningsläsning ska gå till. Till det
tillkommer mänskliga faktorer kopplade till hur skolan och lärare successivt har nedprioriterats av
samhället. Resursbrist i relation till möjligheter till forskningsläsning, känsla av förfrämligande inför
forskningsläsning samt ovilja att bryta rutiner kan här knytas samman med sådana faktorer
(Levinsson, 2013, s. 46). Andra exempel som implementeringsforskningen enligt Levinsson har
upptäckt på att sådana oprofessionella förhållningssätt har vuxit fram, är att forskning ofta används
av lärare i syfte att bekräfta den egna metodens lämplighet oavsett om detta är legitimt att göra. En
annan funktion forskningen kommit att få är som ett verktyg som lärare använder för att upprätta
distans till kollegor genom akademiskt språkbruk (Levinsson, 2013, s. 48) Sammantaget konstaterar
den av Levinsson nämnda implementeringsforskningen att forskningsimplementering inom
utbildningsområdet i allmänhet är svårkontrollerad, oförutsägbar och svår att understödja
(Levinsson, 2013, s. 49).
Formativ bedömning är en metod som OECD enligt Levinsson anser är såväl relevant som direkt
överförbar till skolkontexten. Detta som en följd av dess stora effektstorlekar i systematiska
översikter (Levinsson, 2013, s. 35, 199f, 202). I relation till specifikt formativ bedömning pekar
Levinsson på att en rad implementeringsproblem observerats. Formativ bedömning ses ofta av lärare
som en smärtsam extra börda. Formativ bedömning utifrån kriterieuppfyllnad ses vidare som en
form av externt pålagd kontroll (Levinsson, 2013, studie 3, s. 4ff). Lärare har enligt Levinsson också
tenderat att anamma en snäv definition av formativ bedömning vilken föranlett bedömning av
lärande snarare än den bedömning för lärande som är avsikten med formativ bedömning. Lärares
känslor av förvirring kring implementeringens innehåll och brist på kontroll över dess process liksom
elevers tendens att motverka implementeringen av formativ bedömning är också fenomen som
enligt Levinsson identifierats i mer forskning än dennes egna (Levinsson, 2013, studie 3, s. 6-9).
I sina egna studier, så som dessa sammanställts i dennes doktorsavhandling, tar Levinsson avstamp i
en uppfattning om värdet i att utforska levd erfarenhet inom ramen för vad man inom
fenomenologin kallar livsvärldar. Han utgår således från en fenomenologisk ansats som fokuserar på
samverkan mellan forskare och deltagare. I detta har han arbetat med deltagande observation,
intervjuer, fältanteckningar, reflektionsdagböcker och ljudupptagningar. Fenomenologen Van
Manens recept för konstruktivt bruk av ofrånkomlig och livsvärldsbunden subjektivitet anges vidare
som normerande för arbetet (Levinsson, 2013, s. 78fff). Detta recept föreskriver att egna och andras
upplevelser ska beskrivas bokstavligt utifrån sinnesupplevelser liksom utifrån känslor och stämning
och således inte överdrivas genom exempelvis målande språkbruk (Levinsson, 2013, s. 81). Praktiskt
har arbetet gått ut på initierande av och deltagande i en projektgrupp med lärare vilka arbetat med
att pröva implementering av formativ bedömning. Levinsson applicerar därmed ingen förklarande
teori på situationerna han studerar utan försöker istället fånga hur de studerade lärarna själva
upplever de fenomen som uppstår när kvantitativ evidens ska omsättas i praktiken.
I sin första studie finner Levinsson utifrån denna teoretiska grund att den lärare han studerat,
Anders, befinner sig i en livsvärld som är omöjlig att träda ur vid implementerandet av formativ
utvärdering. Detta medför att implementeringsprocessen måste åtföljas av ett vidgande av Anders
livsvärld som naturligt blir kantat av såväl besvikelser som upplevelser av nya möjligheter (Levinsson,
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
2013, s. 205f, 226). En stor del av problemen som Anders upplever vid implementeringen berör
kommunikationen med eleverna och det faktum att han känslomässigt bryr sig om hur denna
kommunikation fungerar. Anders upplever att eleverna har olika svårt att uttrycka sig om sina
ämneskunskaper när frågor om dessa ställs, varför det formativa samtalet i relation till såväl enskilda
individer som till hela klasser blir lidande. P.g.a. begränsningar i tid och stora klasstorlekar upplever
han också att det blir svårt att lägga ner mer kraft på att lösa kommunikationen. Anders upplever
också att confounders föreligger. Dels i form av att elever försöker framställa sig som mer kunniga än
de är under det formativa samtalet, i tron att de bedöms summativt. Dels i form av att elevernas
motivationsnivåer påverkar deras kapacitet att arbeta med formativa samtal (Levinsson, 2013, s.
223ff). Levinsson menar att det som framgår av studien är att formativ bedömning inte kan
implementeras mekaniskt och att det kan komma att implementeras på många olika sätt som en
följd av lärares olika livsvärldar i termer av verklighetsuppfattningar och prioriteringar (Levinsson,
2013, s. 227ff). Levinssons tredje studie utvecklar dessa fynd genom att följa Henrik, en fysiklärare,
och dennes arbete med att införa formativ bedömning. Denne har provat och upplevt sig misslyckas
med implementering av formativ bedömning som en följd av svårigheten i att förklara innebörden
och värdet i formativ bedömning för eleverna, liksom som en följd av svårigheten att genomföra den
komplexa feedback som krävs. Effekten av det förra upplever Henrik blev att eleverna motsatte sig
implementerandet av formativ bedömning på ett svårhanterat sätt, medan effekten av det senare
upplevdes bli att Henrik började ge för eleverna tydligt meningsbefriad feedback (Levinsson, 2013,
studie 3, s. 13ff). Som en följd av detta hade Henrik återgått till sin traditionella roll för att kunna
förmedla faktakunskaper utifrån begränsade tidsramar som ändå enligt Henrik är svåra att bedöma
formativt. Lojaliteten gentemot eleverna föranledde också en rädsla hos Henrik för att vara för
otydlig genom de formativa omdömena och därmed äventyra elevernas betyg. En rädsla som också
bidrog till att återgången föreföll som en säkrare lösning (Levinsson, 2013, studie 3, s. 16f, 20f).
Henrik drev dock på implementeringsprocessen driven av en känsla av rädsla för att misslyckas med
en formativ bedömning som han upplevde gynnar elevernas lärande mer än traditionell
undervisning. Genom att en ny skolkultur också etablerats som möjliggjorde mer öppna lektioner
blev effekten av detta att Henrik övergav de skriftliga stegen till förmån för ett anammande av vad
han kom att kalla ett konversationsbaserat lärande. Detta lärande bestod i att Henrik ställde öppna
diagnostiska frågor i klassrummet som enligt honom möjliggjorde direkt själv och kamratbedömning
hos eleverna liksom feedback till läraren om elevernas ämnesförståelse (Levinsson, 2013, studie 3, s.
16ff). Vid kollegiala samtal om formativ bedömning visade det sig att Henrik i viss mån var socialt
utfrusen som en följd av att andra fysiklärare tolkat formativ bedömning som lärarcentrerad, d.v.s.
som en metod för utvecklande av undervisningen snarare än en undersökning av elevernas förståelse
så som Henrik tolkat det. Något som orsakade tvivel hos Henrik tills denne genom samtal med
Levinsson och dennes forskarkollega Silwa Claesson fick det klarlagt att den konkreta definitionen av
vad som exakt utgör formativ bedömning är oklar (Levinsson, 2013, studie 3, s. 21f). Henrik erfor
också att dennes involvering i implementerandet av formativ bedömning användes mot honom i
löneförhandlingarna, något som rimligen ytterliggare belyser kontexters komplexitet (Levinsson,
2013, studie 3, s. 19)
Slutsatserna Levinsson drar av Henriks upplevelser är att det är viktigt att i frågan om systematiska
översikters implementerbarhet, beakta hur livsvärldar och psykosociala kontexter påverkar lärarens
känslomässiga inställning till dess implementering. Läraren har när implementeringsarbetet ska
påbörjas etablerat en livsvärld där erfarenheter och verklighetsuppfattningar avgör inställningen till
implementeringen. Samtidigt kommer såväl elever, kollegor som läraren själv, ge läraren feedback
som förorsakar olika nya känslors uppkomst. I Henriks fall blev implementeringsprocessen enklare
först då han erhållit tillräcklig erfarenhet för att känna sig trygg i arbetssättet (Levinsson, 2013, studie
3, s. 23ff). Utifrån sina observationer kring Henriks upplevelser drar Levinsson likartade slutsatser
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
som i relation till Anders, d.v.s. att implementering av formativ bedömning i skolan inte är omöjlig
men däremot allt annat än enkel och förutsägbar. Något som Levinsson menar föranleder problem i
relation till att beslutsfattare på policynivå tror att systematiska översikter är enkla att implementera
(Levinsson, 2013, studie 3 s. 25).
Janna Skagerström tar i sitt kapitel i Nilsens antologi upp det så kallade Riskbruksprojektet som ett
exempel på lyckad implementering av RCT-grundad forskning vars utfall liksom formativ bedömning
till stor del grundar sig på psykosociala faktorer inom ramen för en dialog mellan brukare och klient.
Hon beskriver här hur motiverande samtal (MI), en psykologisk behandlingsmetod som betraktats
som högkvalitativ utifrån RCTer, implementerats effektivt inom mödrahälsovården. Syftet med
projektet var att minska alkoholmissbruket hos gravida genom att förändra bemötandet av dessa
inom mödrahälsovården (Nilsen, 2014, s. 219f). MI som metod har enligt Skagerström i systematiska
översikter av RCTer visat sig ha en absolut effekt på alkoholmissbruk i allmänhet, och en relativ
likvärdighet med andra behandlingsmetoder. I enskilda RCTer menar hon att metoden också har
bedömts ha påtagliga effekter i relation till alkoholmissbruk hos specifikt gravida. MI
implementerades i projektet tillsammans med en form av screeningverktyg för alkoholmissbruk,
AUDIT, som visat sig effektiv utifrån kvalitativa upplevelsestudier (Nilsen, 2014, s. 223). Genom att
kombinera utbildning i MI och i AUDIT med nya arbetsrutiner kring mötet med havande,
implementerades det tänkta projektet mycket effektivt. Skagerström menar att detta delvis bottnar i
att projektet implementerats i en organisation med en mottaglig och enhetlig organisationskultur,
och delvis i projektets stora omfattning (Nilsen, 2014, s. 221f, 226f). Hon analyserar vidare orsakerna
till den lyckade implementeringen genom hänvisning till Everett M. Rogers diffusionsteori där fem
upplevelsefaktorer hos utförarna anses viktiga för framgångsrik implementering; Upplevelse av
relativ fördel, upplevelse av kompatibilitet med praktisk arbetssituation, upplevelse av måttlig
komplexitet i implementeringen, upplevelse av möjlighet att pröva implementeringens effekter samt
observerbar förändring som en följd av implementeringen. Skagerström menar att i synnerhet den
relativa fördelen och komplexiteten upplevts som positiva medan upplevelserna har varit blandade
kring kompatibiliteten och observerbarheten i implementeringen. Prövbarheten har i sin tur varit
oklar som en följd av att projektet visat sig ha haft en framgångsrik ”output” i form av att den tänkta
implementeringen kommit på plats, men samtidigt en oklar ”outcome” som en följd av att inga
påtagliga skillnader i nivån av alkoholmissbruk hos gravida har kunnat observeras före och efter
projektets genomförande (Nilsen, 2014, s. 225f). Skagerström menar således sammantaget att
projektet varit ovanligt framgångsrikt i relation till de svårigheter som brukar föreligga i relation till
implementering, men att detta faller till föga för att implementeringen inte visat sig ha avsedd effekt
på gravidas alkoholmissbruk (Nilsen, 2014, s. 228ff). Något som utvecklas vidare under frågan om
Cochrane-formatets trovärdighet nedan.
7.2.3 Cochrane-formatets trovärdighet i relation till utbildningsområdet
Skagerströms kapitel i Nilsens antologi vilket beskrivits ovan behandlar också huruvida Cochraneformatets trovärdighet kan ifrågasättas på basis av den påfunna bristen på effekt av
implementeringen av MI. Som ovan beskrivits resulterade enligt Skagerström inte användandet av
motiverande samtal i Riskbruksprojektet, i ett minskat missbruk hos gravida, trots att såväl enstaka
RCTer som systematiska översikter av RCTer menade att så skulle vara fallet (Nilsen, 2014, s. 223,
228f). Skagerström menar dock att detta kan bottna i att andra delar av den implementerade
forskningen inte befunnit sig högt upp i Cochrane-formatets evidenshierarki. De kvalitativa
upplevelsestudier som legat till grund för legitimerandet av AUDIT som metod, befinner sig enligt
Skagerström på nivå 4 i den evidenshierarki som presenteras ovan, och uppbär också problem som
en följd av att de inte mäter själva effekterna av AUDIT på gravidas alkoholmissbruk. Introducerandet
av en arbetsrutin där tidigare möten med gravida var en del, var enligt Skagerström i sin tur grundad i
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
en enstaka studie som observerat tendenser till avbrutet alkoholmissbruk som en följd av möten
med mödravården, men som bedrivits utan avsikt att mäta direkta effekter av att förlägga dessa
möten tidigare. Studien placerar sig enligt Skagerström som en följd av detta på nivå 6 i
evidenshierarkin; respekterade auktoriteters åsikter (Nilsen, 2014, s. 229). Riktlinjerna för bruk av MI
var heller inte särskilt rutiniserade enligt Skagerström (Nilsen, 2014, s. 226), något som kan ha
föranlett sporadisk tillämpning. Utifrån Skagerströms slutsatser förefaller snarare förekomsten av
forskning som inte värderas högt i evidenshierarkin, bristen på formalisering av MI samt avsaknaden
av omfattande studier kring just outcome av MI, vara orsakerna till det bristfälliga utfallet (Nilsen,
2014, s. 226, 228f). Utifrån detta blir det relevant att studera Cochrane-formatets trovärdighet
utifrån hur litteraturen beskriver dess egna premisser snarare än utifrån hur dess implementering
fallit ut.
Nilsen tar i sin antologi upp det smått genanta faktum att giltigheten i Cochrane-formatet, där RCTer
som syntetiserats, kvantifierats och systematiserats i metaanalyser och systematiska översikter anses
mest trovärdiga, inte har prövats enligt samma modell, eller likartade modeller. Istället menar
kritikerna enligt Nilsen att denna modell bygger på rationalistiska slutledningar snarare än empiriska.
Alltså en typ av slutledningar som ligger lågt i den ovan angivna evidenshierarkin. De menar här
enligt Nilsen att de positiva resultat man funnit komma utav riktlinjer och standardiseringar utifrån
evidenshierarkin, inte heller är tillräckligt omfattande för att kunna anses verifiera evidenshierarkin,
varför rationalism fortfarande underbygger legitimerandet av metoderna (Nilsen, 2014, s. 55). Här
synliggörs värdet av de vetenskapssociologiska perspektiv som Latour och Wollgar och Helgesson
utgår ifrån nedan. Detta då det är uppenbart att det föreligger betydande risker med att se på
metoder och resultat som helt befriade från mänsklig subjektiv påverkan också i sammanhang där
mycket rationalistisk tankekraft lagts ner på att frammana pålitliga empiriska mätinstrument.
Helgesson beskriver i sitt kapitel i Sager och Bohlins antologi hur flertalet vanliga argument mot fas 4RCTers objektivitet som brukar föras i enlighet med den så kallade ”misstagens sociologi”, präglat
tidigare forskning (Sager och Bohlin, 2011, s. 90). Misstagens sociologi har enligt Helgesson påpekat
att det hänt att RCTer har varit riggade, d.v.s. har varit medvetet utformade för att ge systematiskt
snedvridna resultat. Detta har bl.a. skett genom selektiva doseringar i syfte att få ett specifikt
läkemedel att gå vinnande ur en komparativ studie. Vidare menar han att misstagens sociologi
upptäckt att det ibland förekommer publiceringsbias, där avvikande RCT-fynd uteslutits ur
publikationerna för att ge överdriven effektindikation, samt att situationer uppkommit där ansedda
experter inom olika fält lånat sina namn åt texter som författats av läkemedelsbolag, på ett sätt som
gör det oklart huruvida de namnutlånande experterna alls har tagit del av de primärstudier som
texterna bygger på. Helgesson poängterar att denna kritik emellertid enkelt kan avfärdas genom
referens till att de angivna problemen är resultat av för svag formalisering (Sager och Bohlin, 2011, s.
74f). På så vis har denna typ av kritik små implikationer för RCTers evidensstyrka.
Som en följd av detta har Helgesson gjort en vetenskapssociologisk studie i syfte att studera huruvida
RCTer i sin korrekt utförda form, d.v.s. i enlighet med dess formalisering, innehåller implikationer för
objektiviteten. I syfte att utforska detta har han valt att undersöka utförandet av en fas 4-RCT, vilkens
särart beskrivits ovan. Helgesson har ingen uttalad socialkonstruktionistisk ansats men har liksom
Latour och Wollgar utgått ifrån en tes om att vetenskaplig data också i formaliserad form konstrueras
socialt och, som ovan nämnts, att kritikers fokusering på misstagens sociologi föranlett en möjlighet
för evidensrörelsen att bortförklara trovärdighetsbrister med att för låga nivåer av formalisering varit
föreliggande (Sager och Bohlin, 2011, s. 90). Liksom Levinsson, Latour och Wollgar har Helgesson
också arbetat med deltagande observation för att därmed producera kvalitativ empiri (Sager och
Bohlin, 2011, s. 70). Det empiriska underlaget har sedermera utgjorts av sextio observationer på olika
geografiskt och funktionsmässigt åtskiljda delar av en genomförd fas 4-RCT. Dessa observationer har
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
av Helgesson nedtecknats på anteckningsblock för att sedan föras in i indexerande datasystem (Sager
och Bohlin, 2011, s. 78).
De utföranden Helgesson bevittnade hade en formaliserad procedur som sammanföll väl med den
beskrivning av fas 4 –RCTer som delgetts ovan. Under studiens gång bevittnade Helgesson tre
fenomen som han menar tillsammans med den geografiska spridningen uppbär implikationer för
objektiviteten i den studerade fas 4-RCTn. Detta trots att de enligt honom utgjorde centrala delar av
den formaliserade processen. Dessa tre fenomen var; datatvättning, subjektiva rättanden och idéer
om anomalier som tecken på korrekt utfört arbete. Datatvättning är enligt Helgesson en procedur
där såväl forskningssköterskor som monitor kontinuerligt städar undan avvikelser i formaliseringen så
som uteblivna signaturer eller beskrivningar av åtgärdade problem. Detta på ett sätt som ”rengör”
den data som sedermera skickas vidare till databehandlingskontoret. En forskningssköterska beskrev
enligt Helgesson att då det hände att denna städning uteblev i syfte att tvinga den ansvarige
prövaren att ta större ansvar för proceduren, så kunde stora mängder anmärkningar uppstå vid
monitorns besök som annars hade försvunnit (Sager och Bohlin, 2011, s. 81f).
Datatvätt kan enligt Helgesson vara en följd av att konflikter mellan generella och studiespecifika
regler driver forskningssköterskor att ljuga för monitorn om var journalanteckningar i första hand
antecknats. Det exempel som för Helgesson uppenbaras är att så kan ske på gula postit-lappar
snarare än i föreskrivna formulär. Han menar vidare att det också kan handla om att monitor
upprättar granskningssystem i pärmarna med just gula postit-lappar som forskningssköterskorna
sedermera reflexmässigt städar bort på grund av dålig kommunikation med monitor eller som en del
i städningsprocessen (Sager och Bohlin, 2011, s. 82f). Samma lappar kan alltså enligt Helgesson
upplevas som hjälpmedel för, och motmedel mot, monitorn. Avvikelser avfärdas också ofta enligt
Helgesson genom spekulativa samtal mellan forskningssköterskor och monitorer. Som exempel tar
han upp att en gul postit-lapp som beskriver hur en patient fått medicin som inte ska tas på
morgonen avfärdades som felaktig på basis av att etablerade rekommendationer anger att så inte
ska ske. Lappen i fråga ersattes således enligt Helgesson med en ny gul lapp som angav avvikelsen
vara själva påståendet att så skett snarare än att så har skett. Denna nya gula lapp städades
sedermera bort av monitorn och ersattes av en notis om ändring samt en signatur. Inga av dessa
lappar var således källor som följde med i dokumentationen (Sager och Bohlin, 2011, s. 84).
Utöver datatvättens osynliggörande av uppkomna avvikelser och procedurer för dess avfärdande, så
menar Helgesson att det också skedde rättningar av avvikelser utifrån subjektiva
trolighetsavvägningar när uppgifter i journaler och CRFer skilde sig från varandra.
Forskningssköterskor och monitorer kunde enligt Helgesson komma att besluta om vilken av källorna
som var felaktig och utifrån det korrigera den ena källan i enlighet med den andra källan. På
databehandlingskontoret kunde denna form av bedömning enligt Helgesson ske utifrån upplevd
eminens. Som exempel tar Helgesson upp att en upplevd diskrepans mellan två EKGn föranledde
databehandlingskontoret att enigt tolka dessa som tagna på två olika patienter. Enigheten
föranledde i sin tur att den ansvarige prövarens insisterande på att dessa tagits på samma patient
avfärdades liksom båda EKG-mätningarna. Helgesson menar vidare att tolkning och successiv
normering av innehållet i öppna svarsfält på CRFer är ett annat tillfälle där databehandlingskontoret
rättar till avvikelser på ett subjektivt sätt (Sager och Bohlin, 2011, s. 85f).
Slutligen observerade Helgesson att idéer hos monitorer om att avvikelserna bekräftade
testsituationens autenticitet fungerade som ett sätt att normalisera datatvätt och andra former av
rättningar. Testsituationer utan avvikelser ansågs därmed troligen vara fabricerade medan den typ av
felaktigheter i beskrivning i och mellan journaler och CRFer, uteblivna signaturer, abnormala
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
gränsvärden o.s.v. som bearbetades medelst subjektiva bedömningar ansågs bekräfta studiens
förmåga att resultera i en objektiv slutprodukt (Sager och Bohlin, 2011, s.86f).
Helgessons slutsats i detta är att fas 4-RCTer i första hand är formaliserade i syfte ge maximal
precision och verifierbarhet samt att skapa en upplevelse av autenticitet, inte att skapa exakthet i
resultaten. Han illustrerar det hela genom en liknelse med en regnvattenmätare. Så som fas 4-RCTer
är utformade så säkerställer de enligt Helgesson att de vet att de mäter regnvatten, mäter exakt hur
mycket av detta som befinner sig i regnmätaren och gör också så på korrekt sätt. Problemet menar
han är att regnvattenmätaren läcker och att resultaten således inte representerar hur mycket regn
som faktiskt har fallit. Så som fas 4-RCTer är utformade så kan de alltså enligt Helgesson inte sägas
vara objektiva utan snarare formellt och informellt ordnade på ett sätt som skapar upplevelser av
objektivitet (Sager och Bohlin, 2011, s. 88f). En process som han menar förenklas av den stora
geografiska spridningen där avvikelser går från att för monitorer vara bevis för autenticitet, till att
osynliggöras på resan till databehandingskontoret där i sig ytterliggare subjektiv datatvätt äger rum.
Den verifieringsvänliga och precisionsskapande datatvätten i kombination med avståndens
osynliggörande av denna datatvätt skapar därmed en illusion om att formaliseringen är likställd
objektiviteten. Således framstår studier som präglats av avvikelser och osynliggöranden av dessa
avvikelser som tydliga bevis för resultatens sanningsenlighet (Sager och Bohlin, 2011, s. 91f).
Helgesson menar att dessa fynd gör gällande att bilden av fas 4 RCTer, och i förlängningen RCTer i
allmänhet, behöver nyanseras i syfte att värna om såväl vetenskaplig kvalitétsutveckling som olika
verksamheters förmåga att bedöma lämplighet i forskning innan implementering (Sager och Bohlin,
2011, s. 93).
7.3 Önskvärt hanterande av mångfalden av alternativa evidensdefinitioner utifrån
svenska forskningsperspektiv
Skepsisen mot Cochrane-formatet som framträder i litteraturen har som ovan nämnts haft en effekt
på hur man inom olika verksamheter valt att förhålla sig till evidensbegreppet. Försöken att föra över
Cochrane-formatet från medicinen till andra verksamhetsområden har i Sverige bl.a. inneburit att
betänkanden framlagts om att socialtjänsten bör evidensbaseras genom oklart definierade
kombinationer av systematiska översikter, resultatdokumentation och nationella riktlinjer av
kvantitativ art (Sager och Bohlin, 2011, s. 54). Inom forskningspolitiken har man tolkat bibliometrisk
anslagsfördelning utifrån olika discipliners egna kvalitetsdefinitioner som en form av evidensbaserad
forskningspolitik snarare än att ställa krav på specifika evidensbaserade metoder och samhällelig
användbarhet (Sager och Bohlin, 2011, s. 55f samt 64). Folkhälsovetenskapen, ekologin och
klimatforskningen har i sin tur av såväl etiska som metodologiska skäl, bedömt såväl McMastergruppens som Cochrane-samarbetets respektive evidenshierarkier som orealistiska för ändamålsenlig
forskning inom fältet. Här har istället retrospektiva epidemiologiska undersökningar och andra
former av observationsstudier i stor utsträckning inkluderats i systematiska översikter, metaanalyser
och andra former av syntetiseringar av data (Sager och Bohlin, 2011, s. 56-59). Olika verksamheter
betraktar alltså olika former av vetenskap som legitima och tre upplevda kunskapsområden kan
härmed avtecknas; Evidensbaserade, allmänt vetenskapsbaserade och databaserade. I ljuset av detta
har det blivit relevant för den vetenskapliga debatten att definiera vad det är för typ av metoder som
man betraktar som vetenskapligt legitima och inte i olika kontexter (Sager och Bohlin, 2011, s. 64f)
Författarna spenderar huvuddelen av böckerna åt att kritisera och problematisera Cochraneformatet, men Levinsson, Sager och Bohlin delger också perspektiv på problemen med mångfalden
av alternativa evidenshierarkier och med de krav på vidgning eller breddning av evidensbegreppet
som uppstått som ett svar på evidensrörelsens förfäktande av Cochrane-formatet. Utifrån dessa
perspektiv delger de vad de själva ser som önskvärda vägar framåt utifrån den mångfald av
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
evidensdefinitioner som uppstått. Nedan beskrivs dessa alternativ och vad författarnas tankar kring
dessa är.
7.3.1 Hantering av alternativa evidenshierarkier genom modifierad critical appraisal
Som en följd av de upplevda lämplighetsproblemen med Cochrane-formatet har det som ovan
nämnts inom olika organisationer upprättats kompletterande evidenshierarkier som sinsemellan har
diametralt olika syn på vad evidens faktiskt är för något (Levinsson, 2013, s. 34). Medan det inom
socialstyrelsen, SBU och Läkemedelsverket har ansetts finnas en tillräckligt stor extern validitet i
RCTer sammanställda i systematiska översikter för att utgå från Cochrane-formatet i sin
evidenshierarki (Nilsen, 2014, s. 46f) så har andra verksamheter använt sig av evidenshierarkier som
ansetts anpassade till de specifika fälten, såväl vetenskapligt som praktiskt. En ansedd modell är den
så kallade GRADE-modellen, eller ”Grading of Recommendation Assessment, Development and
Evaluation” som Statens beredning för medicinsk utvärdering (SBU) valt att beakta (Sager och Bohlin,
2011, s. 213). Denna modell vidgar evidensbegreppet, b.la. genom att
uppvärdera
observationsstudier, och lägger vidare fokus på olika former av kvalitetskriterier i studiers design
såsom publiceringsbias, stickprovsstorlek, effektstorlekar, osäkerhet i resultaten och
störningsfaktorer (confounders). En annan modell på frammarsch är 6S-modellen vilken betonar
värdet i att göra forskningsresultat så kortfattade och lättillgängliga som möjligt för yrkesverksamma.
För att åstadkomma detta är evidenshierarkin strukturerad på så sätt att den form av
forskningssammanställning som är mest omfattande och förbedömd, så kallade datorsystem för
beslutsstöd där såväl sammanställningar av systematiska översikter som evidensbaserade riktlinjer
ingår, hamnar i hierarkins topp medan enskilda RCTer vilka ännu inte tolkats kritiskt hamnar i
hierarkins bottenskikt (Nilsen, 2014, s. 48). 6S-modellen är alltså diametralt motsatt McMastergruppens fokus på kontextuell critical appraisal, och istället inriktad på evidenskonsumtion, vad
förfäktare för McMaster-gruppens modell kallat ”the easy fast food option” (Nilsen, 2014, s. 36), i
syfte att överbrygga det gap mellan forskningsresultat och praktiskt utförande som beskrivits som
evidensrörelsens huvudsakliga problemformulering. Inom vårdsektorn finns som en följd av nya
evidenshierarkier en mångfald av systematiska översikter av kvalitativa studier. Dessa förefaller följa
två grundteorier; subjektiv idealism och naiv realism. Medan subjektiv idealism utgår från att
utforskning av oklara förhållandens komplexitet är forskningens mål, utgår den naiva realismen från
att forskningens mål består i att genom rigorös metodologi besvara konkreta frågor och ge konkreta
tillämpningsbara svar på dessa frågor. Exempel på syntetiseringar inom den subjektiva idealismen är
metastudier, metanarrativ, metaetnografier och kritisk tolkningssyntes. Inom den naiva realismen
sysslar man istället med tematiska synteser, ramverkssynteser och ekologisk triangulering (Levinsson,
2013, s. 32).
Levinsson menar att tillkomsten av alternativa evidenshierarkier har föranlett att forskningsläget
blivit motsägelsefullt i takt med att olika mäklarorganisationer har börjat producera systematiska
översikter utifrån fundamentalt olika vetenskapskriterier. Han menar att detta exempelvis har fått till
följd att forskning utifrån olika evidenshierarkier har funnit formativ bedömning vara såväl
överväldigande positiv som direkt skadlig för elevers skolresultat (Levinsson, 2013, s. 101). Att det i
denna mångfald av systematiska översikter, utöver renodlade och blandade former av kvantitativa
och kvalitativa studier, också föreligger skillnader i synsätt på hur studierna ska ha bedrivits och hur
de ska sammanställas på ett relevant sätt för att anses kvalificerade för inkludering i systematiska
översikter, föranleder enligt Levinsson svårigheter med att hantera materialet ute i verksamheterna.
Försök att göra detta menar Levinsson i sig har skett genom uppkomsten av nya former av
systematiska översikter; så kallade metasynteser, som studerar hur skillnader mellan olika former av
studier ger missvisande och förenklade resultat (Levinsson, 2013, s. 31f). Sager och Bohlin påpekar i
likhet med Levinsson att uppkomsten av alternativa evidenshierarkier inom komplexa
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
verksamhetsområden, har ersatt Cochrane-formatets reduktionistiska stringens med de alternativa
formernas vaga relevans. Sager och Bohlin drar därmed slutsatsen att varken det strikta Cochraneformatet eller mångfalden av alternativ evidens i sig själva är gynnsamma för verksamheters strävan
efter ändamålsenlig, implementerbar och trovärdig evidens, något som utvecklas nedan (Sager och
Bohlin, 2011, 211f).
Levinsson menar med hänvisning till tvetydigheten i de budskap kring formativ bedömning som
frammanats av mångfalden av evidensdefinitioner, liksom med hänvisning till sina och andras studier
av problemen med formativ bedömning, att det behöver komma till stånd bättre möjligheter för
lärare att själva kunna kritiskt granska och sålla i denna mångfald av systematiska översikter. Detta
skulle menar han skulle kunna ske genom en modifiering av den ovan beskrivna proceduren för
critical appraisal. Denna modifierade version menar han bör fokusera på bedömandet av
systematiska översikter snarare än primärstudier (Levinsson, 2013, s. 32, 101f). Alltså en form av
upprepad professionsbunden critical appraisal där läraren bedömer forskarbedömd forskning. För att
en sådan typ av verksamhet ska kunna införas menar Levinsson att det dock behövs rejäla
kursändringar hos de parter som har makt över skolutvecklingen och som i paniken över PISAresultaten tolkat evidensbaserad praktik som praktiserandet av en form av okritisk
evidenskonsumtion (Levinsson, 2013, s. 103). Levinsson anser också att det krävs ökade resurser till
skolverksamheten, ett fokus hos skolforskningsinstitutet på att aktualisera systematiska översikter
för den svenska kontexten liksom en lärarutbildning som premierar kritiskt hanterande av forskning
snarare än forskningskonsumtion för att hantera situationen. Något som han ironiskt nog anser
hindras av att lärarutbildningen numera anser att konsumtionsuppsatser av den typ som här
föreligger uppbär legitimitet nog att klassas som examensarbete (Levinsson, 2013, s. 102f, 106).
Sager och Bohlin ser också en modifierad form av critical appraisal som en lösning på problemet med
de vaga evidensdefinitionerna som de alternativa evidenshierarkierna medfört. I detta menar Sager
och Bohlin att det är centralt att den professionelle delges kompetens nog att kunna identifiera vilka
frågor olika evidenshierarkier kan besvara samt vilka brister de har (Sager och Bohlin, 2011, s. 217,
224). De åberopar här att offentlig sektor för att åstadkomma detta bör tillämpa vad
vetenskapsforskaren Harry Collins kallar för socialisationsmodellen där vetenskaplig praktik betraktas
som en effekt av social interaktion med expertis, snarare än som en effekt av formaliserade riktlinjer.
Detta för att i ljuset av det oklara läget med de olika evidenshierarkierna kunna säkerställa att
forskningen både håller hög kvalitet och knyter an till de kontextuella förutsättningarna på ett
gynnsamt sätt (Sager och Bohlin, 2011, s. 221).
7.3.2 Hantering av vidgade och breddade evidensdefinitioner genom modifierad critical
appraisal
Sager och Bohlin menar vidare i det avslutande kapitlet i deras antologi att antologin synliggjort två
diametralt motsatta definitioner av evidens; en konkret snäv definition i enlighet med Cochraneformatet och en abstrakt öppen definition där flera evidenstyper räknas in. Båda
evidensdefinitionerna menar Sager och Bohlin bär på inneboende problem för den evidensbaserade
praktiken. Medan Cochrane-formatet delger tydlighet och metodologisk stringens så medför det som
ovan nämnts också en betydande förenkling av den praktiska kontexten. Den öppna definitionen
medför på motsvarande sätt en teoretiskt gynnsam metodologisk pluralism men samtidigt också
vaga implikationer för den praktiska verksamheten, något vars effekt i Sverige behandlats ovan.
Utifrån detta menar Sager och Bohlin att varken Cochrane-formatet eller den öppna definitionen är
önskvärda val för uppnåendet av evidensbaserad praktik (Bohlin, 2011, s. 211). Sager och Bohlin
presenterar istället två möjliga lösningar på dilemmat som presenterats; ett vidgande av
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
evidensbegreppets innebörd respektive ett breddande av vilken forskning som ska anses
kompletterande till Cochrane-formatets strikta evidensdefinition (Bohlin, 2011, s. 212f).
Idén om ett vidgande av evidensbegreppet menar Sager och Bohlin redan har fått genomslag inom
främst samhälls- och humanvetenskapliga områden så som socialt arbete och pedagogik, samt inom
de administrativa och policymässiga delarna av medicinen. Inom pedagogiken och det sociala arbetet
har man också enligt Sager och Bohlin valt att konkret vidga evidensbegreppet genom att ge
kvalitativa studier, exempelvis intervjustudier och etnografiska fältstudier, likvärdig status (Sager och
Bohlin, 2011, s. 213f). Levinsson ser också ett vidgande som ett tänkbart sätt att förena lärardriven
forskning och Cochrane-formatet. Något han menar skulle stärka kontaktytorna mellan forskning och
yrkespraktik. Tillsammans med evidensbaserad praktik anser Levinsson således att så kallad
aktionsforskning kan bidra till en mer vetenskapsgrundad skola på pluralistiska premisser (Levinsson,
2013,
s.
92f
samt
106f).
Den andra modellen, att bredda vilka forskningstyper som ska anses vara komplementära till
Cochrane-formatets evidensdefinition, har enligt Sager och Bohlin gått under namnet
”kunskapsbaserad praktik”. Idén bygger på att Cochrane-formatets evidensdefinition kompletteras
med vad man kallar för ”övrig vetenskaplig kunskap” samt ”data” (Sager och Bohlin, 2011, s. 215). En
tredje hållning förfäktas slutligen av Sager och Bohlin som går ut på ett minskat fokus på definitioner
av lämplig vetenskap och ett ökat fokus på vilka för- och nackdelar som olika typer av vetenskap har i
relation till olika mål, samt vilka metodologiska begränsningar de har (Sager och Bohlin, 2011, s. 216).
I sitt kapitel i Sager och Bohlins antologi drar Bergmark och Lundström också slutsatsen att deras
fynd kring RCTers brist på ändamålsenlighet inom socialt arbete, liksom deras upptäckter av
förvirring kring evidensbegreppets definitioner, motiverar detta problematiserande förhållningssätt
till evidensbegreppet (Sager och Bohlin, 2011, s. 181f). De menar att det oreflekterade vidgandet av
evidensbegreppet som ägt rum är problematiskt, men enbart i den utsträckning det inte tydliggörs
vilka olikheter som föreligger mellan olika definitioner av evidensbaserad praktik (Sager och Bohlin,
2011, s. 164f).
Som exempel på olikheter som uppbär stor relevans för olika evidensdefinitioners för- och nackdelar
tar Sager och Bohlin upp motsatsparet som varit högaktuellt i debatten om hur god evidens ska
definieras och som genomgående varit i fokus i detta arbete; d.v.s. metodologisk stringens kontra
praktisk relevans. Sager och Bohlin menar att RCTer för att vara gångbara som metod kräver att
deras populationsurval och deras testsammanhang är generaliserbara på kontexter som inte är
ideala, något som av naturliga skäl är svårt att uppnå genom metoden. Registerstudier menar de har
den höga externa validitet som RCTer saknar, som en följd av att de statistiskt säkerställt generellt
gällande sannolikheter. Samtidigt kräver registerstudier en stor mängd data, en varierad population
samt tydliga effekter för att kunna anses generaliserbara. Registerstudier tenderar således enligt
Sager och Bohlin p.g.a svårigheten i detta delge otydliga svar kring lämplig praktik (Bohlin, 2011, s.
218f). Sager och Bohlin menar att följden av RCTers och registerstudiers inneboende problem är att
det inte går att uttala sig generellt om någon lämplig balans mellan metodologisk stringens och
resultatens relevans för lokala kontexter. I och med detta menar de att evidenshierarkier i allmänhet
ger förenklade bilder av vad god evidens är för något. Något som aktualiserar den bild som angetts
ovan av att den lämpliga evidensen bör identifieras genom ett brett fokus på olika evidenstypers
detaljer i relation till för- och nackdelar också i relation till hanterandet av vidgade och breddade
evidensdefinitioner. Som ovan nämnts tänker sig Sager och Bohlin att detta ska ske genom bildandet
av en modifierad form av critical appraisal att identifiera dessa särarter. Sager och Bohlin menar att
detta bör ske utifrån pragmatism och beaktande av olika verksamheters ambitioner (Sager och
bohlin, 2011, s. 223ff).
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
7.4 Rimligheten i antagandet om att objektiv evidens existerar utifrån
socialkonstruktionistiska forskningsperspektiv
Gemensamt för såväl den kritiserade evidensrörelsen och den ovan avhandlade litteraturen är
strävandet efter den mest vetenskapligt trovärdiga definitionen av evidensbegreppet. Ambitionen att
vetenskapsgrunda olika verksamheter är därmed alltjämt i fokus. Jag anser att idén om relativism
aktualiseras som en följd av den ambivalens som identifierats ovan, vars lösningar anges vara
balansakter mellan olika syn på relevant evidens. Med detta avser jag att anledningen till att
balansakter vid ett neutralt studium av rimligheten i olika evidensdefinitioner, framstår som den
enda lösningen, kan bero på att det bara existerar relativt giltig, socialt konstruerad kunskap i
relation till psykosociala verksamhetsområden. Bruno Latour och Steven Wollgar står bakom en
relativistiskt präglad vetenskapssociologisk fältstudie som trots sin ålder ännu idag uppbär relevans
för studiet av huruvida vetenskap i allmänhet har förutsättningar att frammana sådana objektiva
sanningsanspråk som i evidensdebatten varit det centrala målet. Liksom Helgesson identifierar de
sociala processer som navet i den vetenskapliga produktionen av faktum.
I sin studie utgår de tu från en mycket långtgående version av den socialkonstruktionistiska
vetenskapssociologin vilken föreskriver att alla former av försök att utröna objektiva vetenskapliga
betingelser i själva verket innebär en social konstruktion av dessa betingelser. Vetenskap ses som en
följd av detta av Latour och Wollgar som blott en av många arenor för kunskapsproduktion (Latour
och Wollgar, 1986, s. 31). Som en följd av detta undviker de att särskilja det mikrosociologiska
common sense-begreppet från vetenskap och vidmakthåller att samma typ av rationaliserande är
drivande i såväl vardag som i den vetenskapliga praktiken. Latour och Wollgar tar därmed avstånd
från Harold Garfinkels klassiska modell för vad som räknas som common sense-kunskap och vad som
räknas som vetenskaplig kunskap och menar att distinktionen dem emellan inte finns. (Latour och
Wollgar, 1986, s. 153). Detta menar Latour och Wollgar har tre följder; Likhet och olikhet är socialt
konstruerade distinktioner, inte naturligt givna företeelser, teknik och socialitet behöver inte
särskiljas och det behöver inte heller fakta och artifakter (Latour och Wollgar, 1986, s. 253).
Anledningen till dessa följder menar Latour och Wollgar är att sinnesobservationer sorteras i enlighet
med föreliggande sociala förutsättningar och processer. Den sociala kontexten avgör därmed vad
som uppfattas och hur, snarare än naturen självt. Därigenom omvandlas kaos till ordning (Latour och
Wollgar, 1986, s. 33). Studiens syfte anges således av Latour och Wollgar vara att utreda vilka verktyg
som används för att skapa denna ordning. De menar att forskares tendens att tvätta bort den process
som i verkligheten ägt rum vid samtal med utomstående, ställer krav på att sätta sig in vad det
faktiskt är som försiggår i det laboratorium de valt att studera (Latour & Wollgar, 1986, 28f, 36f). De
kan alltså sägas ha velat skildra hur skillnader i livsvärldslogik, för att använda ett fenomenologiskt
begrepp, mellan vetenskapliga och andra typer av resultattolkning i laboratoriet, skapas i syfte att
framställa den vetenskapliga processen som logiskt stringent (Latour och Wollgar, 1986, s. 152)
Genom detta ville de utöka det så kallade starka programmet inom vetenskapssociologin genom att
gå längre än som inom det gjorts hittills. Detta åstadkommer de i sin tur genom att se vetenskapligt
upptäckta objekt som varandes helt igenom socialt konstruerade företeelser (Latour och Wollgar,
1986, s. 152). I kraft av detta motsätter sig Latour och Wollgar såväl makrosociologiska och
ideologiskt drivna sociologiska perspektiv på naturvetenskap i sin studie, liksom det tidigare populära
studiet av misstagens sociologi, vilket omnämnts ovan (Latour och Wollgar, 1986, s. 32, 152).
Det empiriska underlaget i Latour och Wollgars studie har varit en 21 månader lång studie av arbetet
i ett neuroendokrinologiskt laboratorium som bedrivits genom nära daglig kontakt med forskarna i
laboratoriet. Det studerade laboratoriet är enligt Latour och Wollgar känt för sin nivå av rutinisering
och formalisering och de anser därmed detta vara generaliserbart till formaliserad naturvetenskap i
allmänhet (Latour och Wollgar, 1986, s. 31). Studien bedrevs genom fältanteckningar, formella
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
intervjuer, analys av litteraturen använd av vetenskapsmännen på plats liksom annan dokumentation
så som brev och uppsatsutkast (Latour & Wollgar, 1986, s. 18, 39, 153). Latour och Wollgar har också
försökt analysera samtal men har inte använt sig av den standardiserade formen av sådan analys
(d.v.s. inspelade samtal). Istället används anteckningar, kroppspråksanalys, timing och tonation
(Latour och Wollgar, 1986, s. 154). De tu beskriver genomgående sin studie som varandes
antropologisk och betonar därmed ambitionen att liksom socialantropologer traditionellt sett gjort i
relation till ursprungsbefolkningar, komma till botten med den common sense som präglar de
studerade vetenskapsmännens upplevelser. Detta har skett genom deltagande observation i enlighet
med socialantropologisk tradition där en del av processen att förstå vad som pågår i laboratoriet har
varit att se på situationen i sin helhet som i sig självt främmande, d.v.s. som en kontext där inga
förgivettaganden eller accepterande av vedertagna faktum får äga rum. En del i detta menar Latour
och Wollgar är att upplösa distinktionen mellan det tekniskt och det socialt logiska, så som ovan
omnämnts (Latour & Wollgar, 1986, s. 27f, 29f). Genom levd erfarenhet som laboratorietekniker,
öppen observation, samverkan och informering av deltagare har Latour och Wollgar med hjälp av
metoderna omnämnda ovan, försökt leva sig in i de studerade forskarnas verklighet (Latour och
Wollgar, 1986, s. 40).
Latour och Wollgar kallar aldrig sin metod för vad som inom vetenskapssociologin kallas
etnometodologi, men motviljan gentemot funktionalismen liksom idéerna om social konstruktion
som allenarådande inom vetenskapen, indikerar starkt att Latour och Wollgars monografi syftar till
att bryta med det inom vetenskapssociologin förhärskande starka programmets något mildare syn på
möjligheterna till objektiv vetenskap till förmån för en mer etnometodologisk inställning (Latour och
Wollgar 1986, s. 32). Steve Wollgar tillskrivs också titeln etnometodolog i Per Månssons bok Moderna
samhällsteorier medan själva studien i fråga beskrivs som en etnometodologisk klassiker (Månsson,
2007, s. 211, 213). Det som talar emot denna klara definition är Latour och Wollgars konsekventa
skildringar av sociala förhandlingar om verkligheten där nivå av trovärdighet, eller credibility, något
som förefaller tangera Pierre Bourdeaus kapitalformsbegrepp, avgör vilka påståenden som successivt
omvandlas till faktum inom forskningsfältet. Något som förefaller antyda spår av nätverksteori.
Studien är i kraft av sin ålder inte en studie om de allra modernaste forskningsmetoderna så som
RCTer och systematiska översikter, men belyser påtagligt den form av logik som legat till grund för
och underbygger dessa metoder och vetenskaplig metod i allmänhet.
7.4.1 Vetenskapliga studiers trovärdighet som evidens
Latour och Wollgars studie, vilken refereras till av Helgesson, tangerar Helgessons resonemang kring
fas 4-RCTer i relation till hur subjektiva bedömningar vilka bl.a. drivs genom beaktande av eminens,
döljs genom olika former av datatvätt. Latour och Wollgar tycker sig under sin studies gång ha
observerat hur de studerade forskarna använt sig av konstruerad så kallad ”fenomenoteknik” för att
åstadkomma denna datatvätt. Med fenomenoteknik avser Latour och wollgar metoder som
möjliggör upplevelsen av att objekt existerar objektivt, d.v.s. har vad författarna kallar för en ”out
thereness”. På detta sätt har forskarna enligt Latour och Wollgar genom sociala och intellektuella
processer lyckats socialt konstruera maskiner som ger ett sådant intryck. Dessa maskiner, och annan
skapad utrustning, är således enligt Latour och Wollgar sociala intellektuella konstruktioner på
samma sätt som forskningen som använder dem i sig. På detta sätt kan artificella kopior av
påståenden skapas som ger dessa påståenden en känsla av existens utanför påståendena (Latour och
Wollgar, 1986, s. 64, 238, 176). Liksom Helgesson menar Latour och Wollgar således att bevisen för
denna sociala konstruktion raderas. Detta samtidigt som betydelsen av de uppmätta effekterna
överdrivs. Utifrån observationerna av detta menar Latour och Wollgar att det logiska individuella
tänkande som brukar framställas som grunden för vetenskaplig verksamhet, i själva verket är grundat
i sociala sammanhang (Latour och Wollgar, 1986, s. 173f).
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Latour och Wollgars fortsatta resonemang om det sociala sammanhanget knyter an till Helgessons
observation av hur dolda subjektiva bedömningar utgör en naturlig del av den kvantitativa
forskningsprocessen i en fas 4 -RCT. Latour och Wollgar menar att de informella samtal som de
observerat till skillnad från laboratoriets skriftliga redogörelser, delger en empirisk bild av hur den
vetenskapliga processen går till då den inte har tvättats bort genom utebliven redogörelse eller
formalisering. De menar därmed att informellt kommunicerad information är det ledande medan
formell sådan blott utgör ett undantag i syfte att legitimera den informella processen (Latour och
Wollgar, 1986, s. 168, 252). Här observeras alltså samma fenomen som i Helgessons studie. Latour
och Wollgar breddar dock den bild som Helgesson uppmålat av vilka sociala processer som
underbygger dessa informella påverkansfaktorer, och lanserar ett beskrivande begrepp för vad de
menar att det egentliga syftet med vetenskaplig verksamhet är; att cirkulera i den så kallade
kredibilitetscykeln.
7.4.2. Den sociala konstruktionen av framgångsrika vetenskapsparadigm
Figur 2 Latour och Wollgars kredibilitetscykelsmodell
(Latour och wollgar, 1986, s. 201)
Kredibilitetscykeln är enligt Latour och Wollgar en central del av meningen med verksamheten i
laboratoriet de studerat. Denna cykel består av sex delar som gås igenom i tur och ordning;
Erhållande av vetenskapligt erkännande, erhållande av anslagspengar, erhållande av utrustning,
produktion av data, argumenterande för data samt artikelskrivande om resultatet av denna
argumentation. Dessa delar gås igenom cykliskt tills forskaren trillar ur som en följd av brist på
erkännande (Latour & Wollgar, 1986, s. 201). De studerade forskarnas primära ambition är enligt
Latour och Wollgar att försöka effektivisera resan genom kredibilitetscykeln då detta förstärker
bilden av deras vetenskapliga briljans. Detta menar Latour och Wollgar sker genom strategiska val av
forskningsinriktning, kollegor, problemområden, metoder, hypoteser o.s.v. (Latour & Wollgar, 1986,
s. 206f). På detta sätt menar de att forskaren positionerar sig strategiskt för att genomgå cykeln.
Karriärväg, fältets situation, resurstillgång och positionens fördelar blir därmed verktyg som används
för att vinna kampen om effektiv cykelgenomgång. Forskarnas positioner blir på detta sätt enligt
Latour och wollgar också socialt konstruerade i och med att de mer är föremål för sociala strategier
än objektiva förtjänster (Latour & Wollgar, 1986, s. 212f). Latour och Wollgar menar slutligen att
forskarna i denna process använder sin trovärdighet som kapital som konsekvent investeras i
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
kredibilitetscykeln i syfte att uppnå mer trovärdighet (Latour & Wollgar, 1986, s. 197f).
Kredibilitetscykeln utgör härmed en modell som indirekt synliggör varför just kvantitativ
metodologisk stringens fått sådant anseende i debatten om lämpliga evidensdefinitioner. Detta
genom att den illustrerar hur styrkan i forskningsparadigm vilar på hur enkelt det är att bekräfta
paradigmets giltighet, något som rimligen förenklas av att subjektiviteten i forskningen döljs så som
ovan beskrivits. Enkelheten i att bekräfta ett forskningsparadigms giltighet är utifrån detta avgörande
för hur mycket pengar som investeras i det och hur många forskare som väljer att befinna sig i det.
En central del av försöken att vara i kredibilitetscykeln menar Latour och Wollgar är att bedöma
personers trovärdighet, något som knyter an till Helgessons beskrivning av eminens som verktyg för
att socialt reda ut avvikelser i mätdata. Anledningen till att detta utgör en central del av
genomgåendet av kredibilitetscykeln menar de är att forskarna är beroende av varandras förmåga att
vara i cykeln för att själva kunna vara det (Latour & Wollgar, 1986, s. 202f). De ger ett antal konkreta
exempel på hur detta går till socialt. Det första fallet de observerar är ett socialt utbyte mellan
forskare som syftar till att stärka vissa påståenden och försvaga andra påståenden. Detta genom
hänvisande till starkare påståenden och den påstående forskarens tidigare misslyckanden med att
kvarstanna i kredibilitetscykeln, d.v.s. dennes oförmåga att stärka sina påståenden genom
övertalning (Latour och Wollgar, 1986, s. 155). Det andra fallet de observerade var hur två forskare
sinsemellan försökte reda ut vad som är det mest strategiska sättet för dem att bedriva ett
samarbete. Centralt i detta sociala utbyte var resonemang kring vilka peptidkvantiteter som
föranleder ett bra motangrepp mot påståendet att injicerade peptider har en psykobehavioristisk
effekt. I fokus för forskarna stod här enligt Latour och Wollgar alltså inte bara själva bidraget till
kunskap, utan också viljan att effektivt genomgå kredibilitetscykeln. Detta menar de pekar på att
påståenden inte är objektiva utan snarare drivna av intresset av att stanna i cykeln. Det tredje fallet
Latour och Wollgar observerade utgjorde ett exempel på att forskarna utöver rena förhandlingar om
påståendens giltighet, av praktiska skäl också måste göra bedömningar om hur forskningen ska
bedrivas utifrån vad de anser är acceptabel professionell praktik, hur mycket tid och resurser som
finns tillgängliga samt hur stora riskerna för framtida vetenskaplig kritik är (Latour och Wollgar, 1986,
s. 159). I det fjärde fallet observerade de hur sådan rationalisering av sätt att kvarstanna i
kredibilitetscykeln, kan bli trumfad av en ovilja att ifrågasätta påståenden som en följd av att dessa
påståenden förvisso riskerar ha svårt att stanna i kredibilitetscykeln men samtidigt omhuldas av
forskare med högre nivåer av trovärdighet (Latour och Wollgar, 1986, s. 161f). Som en följd av detta
drar Latour och Wollgar slutsatsen att också auktoritära påståenden kan bli vägledande som en följd
av svårigheter att definiera alternativa påståenden på samma trovärdighetsnivå, något som också
Helgesson observerat. Likväl kan, som beskrivs nedan, språkbruket i en artikel, bruk av fotnoter eller
argumentationsteknik vid övertyganden försvåra alternativa påståenden. Sammanlagt innebär detta
enligt Latour och Wollgar, att trovärdighetsnivå samt social förhandling driver ”common sense”,
d.v.s. subjektivt förnuft, på samma sätt som i vad man inom fenomenologin kallar för ”livsvärlden”
(Latour och Wollgar, 1986, s. 156ff).
Latour och Wollgar liknar den observerade sociala processen vid ett spel, där poängen är att
utvärdera vilka investeringar som krävs för att driva igenom ett påstående samt vilken avkastning
som denna investering får i slutändan. De menar därmed att etiska forskningsregler är mindre
relevanta för de observerade forskarna än detta spel (Latour och Wollgar, 1986, s. 243). I deras femte
observerade fall illustreras denna slutsats tydligt genom att Latour och Wollgar observerar hur data
producerad av en forskare med låg trovärdighet avfärdas av forskare med högre trovärdighet för att
dessa ska undvika risken att falla ur kredibilitetscykeln. Detta fenomen, vilket Latour och Wollgar
klassificierar som en typ av common sense-psykologi/sociologi, menar de har varit mycket vanligt
förekommande under deras studie (Latour och Wollgar, 1986, s. 163f). Utifrån dessa och andra
observationer av det sociala samspelet har Latour och Wollgar observerat fyra diskussionstyper som i
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
laboratoriet konsekvent används i syfte att socialt konstruera objekt i enlighet med
kredibilitetscykelns krav: Informationsutbyte om vilka påståenden som stabiliserats, d.v.s. uppnått
faktastatus, Tekniska påståenden om forskningsmetod, Teoretiska påståenden och slutligen
strategiska bedömningar av personers trovärdighet (Latour och Wollgar, 1986, s. 160-164). De
identifierar också en rad särdrag i den sociala interaktionen: Många separata intressen präglar
samtalen, rent tekniska, deskriptiva och teoretiska samtal är sällsynta och forskarnas tankeprocesser
är inte heller i någon större utsträckning annorlunda än vardaglig common sense. Latour och Wollgar
drar slutsatsen att dessa observationer stödjer teorin om den sociala konstruktionen (Latour och
Wollgar, 1986, s. 166). Det sociala samarbetets funktion för skapandet av upplevt objektiv vetenskap
inom det forskningsparadigm som Helgesson studerat i en fas 4 –RCT, utvecklas alltså i Latour och
Wollgars studie till att innefatta en social kamp om att åstadkomma detta och därmed successivt
belönas med allt högre nivåer av trovärdighet. I såväl Helgessons studieobjekt som i Latour och
Wollgars sådana syftade därmed den sociala konstruktionen av objektiva fakta mer till att bekräfta
forskarnas liksom de utomståendes uppfattning om forskningens vetenskaplighet än till att sträva
efter verklighetsförankring i resultaten.
7.5.3. Forskningssammanställningars trovärdighet som evidens
Latour och Wollgars studie ger trots att den inte specifikt behandlar dem, perspektiv på såväl
registerstudier som metaanalyser och systematiska översikters inneboende logik så som dessa
grundas i naturvetenskaplig kvantitativ metod. På samma sätt som data enligt Latour och Wollgar
tvättas ren från spår av subjektiv påverkan under forskningens gång genom fenomenoteknik och
informella sociala processer, så finner de att uppnådda resultat av detta tvättande också i sin tur
tvättas rent från eventuella spår av subjektivism. Inskriptionsmaskiner och annan använd
laboratorieteknik, tas därmed för given eller glöms helt bort. Genom detta menar de att den
vetenskapliga processen glöms bort när väl resultaten har uppnåtts och att data därmed anses
härstamma ur en objektiv källa, fri från subjektiv påverkan. På så sätt fastställs illusionen om ett
faktum (Latour och Wollgar, 1986, s. 63).
Systemet för detta utvecklade osynliggörande menar Latour och Wollgar bottnar i formalisering,
liksom det ursprungliga osynliggörandet. När verksamheten i laboratoriet formaliseras och rutineras
menar de att det blir möjligt för forskarna att bortse från fenomenoteknikens långa
konstruktionsprocess, samt dess materiella förutsättningar. Istället beskrivs tillkomsten av objekt
som produkten av idéer, teorier och anledningar medan laboratoriets praktiska och materiella
verksamhet glöms bort. Latour och Wollgar menar att detta innebär att det trots att det är just de
materiella konstruktionerna som skapar fenomenen och gör det möjligt att säga att saker existerar,
så ges mycket liten uppmärksamhet åt dessa konstruktioner i den traditionella redogörelsen för
vetenskapliga händelseförlopp (Latour och Wollgar, 1986, s. 69). Utifrån resonemanget kan man
hävda att det sätt på vilket de påståenden och studier som ingår i metaanalyser, systematiska
översikter och andra forskningssammanställningar successivt glöms bort, så glöms också de
påståenden och studier som legat till grund för konstruktionen av en maskin.
Ovan har beskrivits hur forskarna socialt konstruerar sina forskningsfynds objektivitet genom
datatvätt som driver fram en glömska kring forskningens tillblivelse. Latour och Wollgar introducerar
i denna process en central variabel, nämligen övertalningen. Utöver skapare av fenomenoteknik i
form av maskiner menar Latour och Wollgar att forskarna är skickliga övertalare. Detta menar de
innebär att forskarna är skickliga på att övertala/övertyga utomstående om att det de gör är viktigt,
sant och värt att finansiera, samt att de utomstående inte alls blir övertygade utan bara presenteras
en serie logiskt konsekventa bevis. Andra forskare övertalas därmed enligt Latour och Wollgar att de
inte övertalats och att det är onödigt att därför beakta gråskalor mellan upplevelser. Latour och
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Wollgar menar att övertalandet/övertygandet artar sig som så att även utomstående
övertalas/övertygas om att de materiella förutsättningarna saknar relevans och att resultaten kan
betraktas som fakta (Latour och Wollgar, 1986, s. 70).
Utöver den informella övertalningsprocessen sker enligt Latour och Wollgar övertalningar konkret
genom annan fenomenoteknik än maskiner; d.v.s. genom skriftliga framställningar. De menar att de
funnit att de texter som forskarna använder för att rapportera om sina fynd till utomstående, är en
form av övertygande genom ett osynliggörande av framställningens avsikt att övertyga. Genom ett
formspråk som utstrålar objektiv faktaåtergivning kan läsaren av texten enligt Latour och Wollgar
övertygas utan att själv märka att det är just det som har skett. På detta sätt menar de att
påståenden som tidigare varit föremål för kontrovers och debatt, kan framställas som
oproblematiska och oemotstridliga faktum. Påståenden kan enligt Latour och Wollgar också stagnera
på så sätt att de inte leder till nya fynd eller att de förintas genom att andra påståenden gjorda av
aktörer med högre nivå av trovärdighet motsäger dem. Slutligen menar Latour och Wollgar att
påståenden genom återanvändande av andra snabbt solidiferas och blir nästintill obestridliga. De
ingår då i uppbyggnaden av en maskin eller i kurslitteratur och undgår kritisk granskning (Latour och
Wollgar, 1986, s. 87). Om maskiner producerar samma effekt under samma förhållanden och om
denna likhet bekräftas socialt genom påståenden, så menar Latour och wollgar att effekten får status
som ”out there”, d.v.s. objektiv. Samma sak menar de är fallet med påståenden och texter; om olika
forskare frammanar samma påståenden så ses det som en indikation på att man talar om något ”out
there” (Latour och Wollgar, 1986, s. 83f). Den observerade cirkulära processen är således enligt
Latour och Wollgar att konflikter mellan påståenden leder till att vissa påståenden vinner medan
andra förlorar utifrån trovärdighetsnivå. De vinnande påståendena publiceras sedermera som fakta
och dessa litterära versioner av påståendena ligger till grund för byggandet av maskiner eller
utformandet av läroböcker. Maskiner och läroböcker används och producerar mätdata i enlighet
med de påståenden som legat till grund för dem. Dessa mätdata blir föremål för nya konflikter
mellan påståenden. Vinnande påståenden publiceras som fakta o.s.v. (Latour och Wollgar, 1986, s.
87). Den solidifiering av vetenskapliga påståenden genom sociala bekräftelser som Latour och
Wollgar här påtalar kan rimligen i högsta grad anses applicerbart på vetenskap i största allmänhet.
Latour och Wollgar menar också att konstruktionen av fakta, eller av ”verkligheten”, förstärks av att
de påståenden som stabiliserats av höga nivåer av trovärdighet hos de som drivit dem,
återintroduceras i laboratoriet som vedertagen utrustning och forskningsprocedur. På detta sätt blir
trovärdighetskostnaden till slut så hög att paradigmskiften genom nya påståenden blir nästan
omöjliga (Latour och Wollgar, 1986, s. 243). De exemplifierar hur detta har skett genom hänvisning
till två maskiner vilka uppbär olika mängd trovärdighet utifrån dess tillkomstprocess i enlighet med
det ovan nämnda; mass-spektrometern och tunnlagerkromatografin. Medan mass-spektrometern
bygger på majoriteten av tidigare forskning inom en del av fysiken är tunnlagerkromatografin mycket
omstridd. Detta menar Latour och Wollgar medför att det är mycket kostsamt att uppnå tillräcklig
trovärdighet för att ifrågasätta de påståenden som mass-spektrometern frammanar, medan
tunnlagerkromatografins påståenden lätt kan bemötas med andra påståenden. Detta menar de i sin
tur beror på att de tidigare påståenden som mass-spektrometern bygger på, har tvättats bort, d.v.s.
de ingår i vad Latour och Wollgar kallar för en ”svart låda” som ger skenet av faktastatus. Innehållet i
denna låda är mycket kostsamt att ifrågasätta trovärdighetsmässigt, d.v.s. det kräver minst
motsvarande nivå av trovärdighet som redan investerats för att lyckas. Pengar, auktoritet,
självförtroende och belöning menar de i detta är centrala begrepp. Följden är att välutvecklade
vetenskapliga paradigm tenderar att bestå också av denna anledning (Latour och Wollgar, 1986, s.
242).
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Latour och Wollgar illustrerar och förtätar bilden av denna process genom att hänvisa till hur ett
”objekt” konstruerats av forskare inom neuroendokrinologin; det tyreotropinfrisättande hormonet
(TRH). Latour och Wollgar menar att TRH, liksom vetenskapliga objekt i allmänhet gör, började sin
resa till faktastatus genom att kriterier för likhet och urskiljande av repeterbarhet av denna likhet
möjliggjorde avfärdande av avvikelser/artifakter som bakgrundsbrus (Latour och Wollgar, 1986, s.
126). De menar att vetenskapens själva definition av verkligheten är ett sorterande, i vilket socialt
etablerade signaler utgör likhetsnorm för eftersökta signaler. Detta i syfte att ordna upp en oordning
som utgör regel snarare än undantag i vetenskapliga sammanhang. Denna regel innebär enligt Latour
och Wollgar att det faktuella bakgrundsljudet blott producerar kaos, medan själva ordningen
konstrueras socialt (Latour och Wollgar, 1986, s. 246, 252). Ett objekt såsom TRH, skapas alltså enligt
Latour och Wollgar av att distinkta signaler urskiljs och kontrasteras mot bakgrundsbruset av andra
signaler, som genom en lång och kostsam process planats ut. Det existerar som ett verkligt faktum,
men det är ett faktum som konstruerats (Latour och Wollgar, 1986, s. 127). Trovärdighetsgrundade
sociala övertyganden menar de alltså bygger på klara definitioner av vad som utgör likhet och vad
som i en mångfaldssituation utgör trolig/tillräcklig likhet. Skillnader och mångfalder av troligheter
menar de kan förklaras bort genom datamanipulation inom normerna för bevisföring, d.v.s. genom
det övertygande och den konstruktion som beskrivits ovan (Latour och Wollgar, 1986, s. 241f). Enligt
Latour och Wollgar valdes TRH genom denna process ut ur en mångfald logiskt likvärdiga alternativ
och blev därigenom socialt stärkt som faktum – ett konstruerat objekt (Latour och Wollgar, 1986, s.
148). Ett objekt konstrueras som ovan nämnts av bl. a. skriftliga redogörelser för inskriptioner från
maskiner, men dess soliditet uppnås enligt Latour och Wollgar genom det kontinuerliga tillskottet av
metod från andra erkända fält (Latour och Wollgar, 1986, s. 127). Ett fenomen som förefaller ha varit
centralt för legitimerandet av olika typer av human- och samhällsvetenskapliga fält och som rimligen
är centralt för den pågående uppstruktureringen av utbildningsområdets vetenskapliga grund där,
som detta arbete belyser, det medicinska Cochrane-formatet angetts som en lämplig metod att låna
in i kraft av dess paradigms hårdhet.
Laboratorieforskarnas upplevelse av TRHs ”out thereness” bygger enligt Latour och Wollgar enbart
på den sociala konstruktionen av denna upplevelse. TRH är således enligt resonemanget inte
resultatet av att inskriptioner antytt dess existens, TRH som objekt/fakta är snarare identisk med
inskriptionen. Således menar Latour och Wollgar att TRH inte kan ses som ett ”upptäckt” fenomen
utan snarare som ett fenomen som konstruerats tack vare forskarnas kreativitet (Latour och Wollgar,
1986, s. 128f). TRH uppstod därmed som en följd av samspelet mellan två konkurrerande gruppers
respektive materiella förutsättningar samt deras strategier för att kvarstanna i kredibilitetscykeln
(Latour och Wollgar, 1986, s. 134). Det omvandlades sedermera från påstående till faktum år 1969.
Den nioåriga process som legat bakom dennas tillväxt blev enligt Latour och Wollgar genom detta
omvandlande ointressant att beakta för forskare. Hur upptäckterna gjorts och vad forskarna som
gjort dem hette ansågs nu irrelevant och ointressant. (Latour och Wollgar, 1986, s. 175). Latour och
Wollgar kan genom det de funnit konstatera att kombinationen av formaliserandet av
trovärdighetsgrundade sociala övertyganden och materialisering av övertyganden, liksom datatvätt i
syfte att datamässigt dölja denna process, medför att faktakonstruktionen effektivt döljer sitt eget
tillblivande (Latour och Wollgar, 1986, s. 240).
Återigen aktualiseras betydelsen av
forskningssammanställningar av olika slag. Exempelvis de uppmätta effektstorlekarna av formativ
bedömning som av Levinsson problematiseras i detta arbete kan utifrån resonemanget
problematiseras.
Genom Latour och Wollgars studie kan vi så här långt se klara implikationer för den logik som
underbygger metaanalysers, systematiska översikter och andra forskningssammanställningars
objektiva framtoning. Utbildningsvetenskapliga effektstudier kan utifrån resonemanget sägas
bedrivas utifrån sociala övertalningar. Övertalningar som sedermera tvättas bort genom skriftliga
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
framställningar vars primära syfte är att övertyga läsaren om tydlighet i de uppmätta effekterna.
Detta i syfte att underlätta för den författande forskaren med ansvariga kollegor, att kvarstanna i
kredibilitetscykeln. Dessa framställningar omvandlas sedermera till effektstorlekar i omfattande
metaanalyser och systematiska översikter. Den tvättade datan tvättas därmed en andra omgång.
Metaanalyserna och de systematiska översikterna används sedermera som utgångspunkt för nya
studier vars resultat avgörs av sociala övertalningar inom ramen för de fynd som metaanalyserna/de
systematiska översikterna redan delgett som faktum. Utifrån resonemanget kan exempelvis de
uppmätta effektstorlekarna i John Hatties stora metastudie tolkas som grundade i subjektiva
bedömningar och intressen, samt i sociala processer och övertalningar; d.v.s i sociala konstruktioner.
Sociala konstruktioner som successivt kommer att solidifieras som obestridliga faktum genom allt
mer komplexa påbyggnadskonstruktioner som är svåra att uppmana tillräckliga resurser för att
utmana. Att själva omfånget på Hatties studie idag tas som intäkt för dennas kvalité kan ses tala för
relevansen av Latour och Wollgars studie i detta avseende.
7.5.4 Följderna för strävandet efter objektiv vetenskap
Slutsatserna Latour och Wollgar drar av sina observationer är att den naturvetenskapliga
forskningsmetoden som p.g.a. formalisering och datatvätt anses vara kapabel att producera
objektiva faktum, i själva verket är obotligt bunden till sociala processers subjektiva skapande av
skenbara faktum. I sin relativism i relation till möjligheten att upptäcka objektiva faktum är Latour
och Wollgar här mycket långtgående. De menar att fakta och artifakter inte är synonyma med sant
och falskt. Istället är de påståenden som befinner sig olika långt från beskrivningen av deras
konstruktion. Ju längre ifrån genesis, desto mindre redogörelse för denna konstruktion. Därmed
uppstår illusionen om det objektiva faktumet (Latour och Wollgar, 1986, s. 176). Att påståenden och
objekt framstår som separata ting menar Latour och Wollgar enbart beror på att påståendet har
misstagits för objekt. Således är det en illusion att objektiva fakta föranlett påståenden (Latour och
Wollgar, 1986, s. 177). Latour och Wollgar menar härmed att fakta och verklighet förvisso existerar
objektivt men bara som en följd av en social konstruktion utav dem. Som en följd av detta kan de inte
existera oberoende av denna konstruktion (Latour och Wollgar, 1986, s. 181f).
Latour och wollgar menar att deras slutgiltiga resonemang bär implikationer för deras egen studie i
och med att denna inte kan sägas skilja sig från den forskning de observerat. Således menar de att
den inte heller kan eller bör ses som objektiv, utan snarare som lika fiktiv som den vetenskapsstyp
som studerats, något som tangerar också Sager och Bohlins utgångspunkt som dock är mindre
relativistisk (Sager och Bohlin, 2011, s. 22). Den enda skillnaden mellan de studerade forskarna och
Latour och Wollgar själva menar de består i den mindre mängd trovärdighetskapital som de haft i
jämförelse med dessa (Latour och Wollgar, 1986, s. 254, 256ff). I båda fallen anser alltså Latour och
Wollgar att det handlat om att konstruera fakta genom ett fastställande av likheter och skillnader,
selektivt urval, eller tvättande, av data liksom slutligen en form av övertalande i skriftlig form. Detta
resonemang medför att inte bara kvantitativ utan också kvalitativ forskningsmetod så som den som
använts av många av författarna i den svenska litteraturen som här behandlats, är inkapabel att
frammana objektiva sanningar. Likheterna i förhållningssätt menar Latour och Wollgar gör
distinktioner mellan mjuk och hård vetenskap svåra (Latour och Wollgar, 1986, s. 255f).
Latour och Wollgar menar vidare att det faktum att vetenskapsmän konstant reflekterar över om
påståenden och metodologiska följder av påståenden faktiskt existerar objektivt, gör det orealistiskt
att lämna debatten om positivism kontra relativism till filosoferna och att därmed se vetenskapen
som separerad från denna debatt (Latour och Wollgar, 1986, s. 179). Argumentet om att
vetenskapliga faktums användbarhet utanför laboratoriet motiverar att kalla dem verkliga oavsett
filosofiska resonemang, menar de faller som en följd av att applicering av laboratoriegrundade
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
resultat utanför laboratoriet i själva verket handlar om att överföra laboratoriets teknik till andra
miljöer, t ex sjukhus och inom industrin. De menar alltså att det lika lite går att säga att ett etablerat
faktum inte fungerar som det går att frikoppla det från laboratoriets definition av fungerande (Latour
och Wollgar, 1986, s. 182f). Ett resonemang som rimligen uppbär relevans för vetenskap i allmänhet
och som summerar Latour och Wollgars studies bidrag till den vetenskapsteoretiska debatten.
8. DISKUSSION OCH SLUTSATS
Som framgått av den kritik mot Cochrane-formatet som presenterats ovan så är dess
evidensdefinition enligt den undersökta litteraturen varken tillräckligt trovärdig, d.v.s. internt
stringent (enligt Helgesson, Latour, Wollgar, Bergström och Lundmark) eller tillräckligt ändamålsenlig
och implementerbar, d.v.s. externt relevant (enligt Levinsson, Sager och Bohlin, Nilsen, Bergström
och Lundmark) för att rakt av kunna tillämpas inom utbildningsområdet. Skagerströms kapitel i
Nilsens antologi utgör ett undantag i det att hon identifierat en effektiv och relativt oproblematisk
implementering av psykosocial evidens grundad i Cochrane-formatet. Samtidigt har
implementeringen skett på en implementeringsarena som på flera sätt förefaller vara mer mottaglig
för Cochrane-formatet än vad utbildningsområdet är, något som Skagerström illustrerar genom
Rogers diffusionsteori. Motiverande samtal (MI) som metod är också rimligen betydligt enklare att
implementera och mer kortsiktigt utvärderbar än formativ bedömning, som jag använde som
utbildningsvetenskaplig referensram i redogörandet för Skagerströms kapitel. Skagerström anger
också att framgångsrikt användande av MI mättes i frekvens snarare än i kontinuitet, varför liknelsen
med formativ bedömning blir lidande. Av detta följer att den kontext som i Skagerströms kapitel
behandlas, bör anses för olik utbildningsområdet för att tillåta en direkt jämförelse som legitimerar
Cochrane-formatets implementerbarhet. Skagerström förklarar som ovan nämnts bort att
implementeringen av Riskbruksprojektet inte haft någon observerbar outcome genom hänvisning till
att komplementen till MI, AUDIT och tidigare möten, inte uppfyllt kraven för de högre nivåerna i den
evidenshierarki som Nilsen presenterat och som utgår från Cochrane-formatet. I ljuset av Bergmark
och Lundströms konstaterande om drontens domslut och RCTers oförmåga att beakta
motivationsbrist, så menar jag dock att bristen på effekt också i Skagerströms studie är problematiskt
för Cochrane-formatets trovärdighet. Renodlat positivistiska förhållningssätt till utbildningsområdet
förefaller, i kraft av det ovanstående, orimliga. Samtidigt anser jag det inte befogat att i kraft av de
fynd som gjorts i detta arbete avfärda Cochrane-formatets lämplighet för utbildningsområdet helt
och hållet. Detta av flera anledningar som berör såväl ändamålsenligheten, implementerbarheten
och trovärdigheten.
För det första bottnar en del av argumenten mot Cochrane-formatets ändamålsenlighet som Nilsen
och Levinsson tar upp, i teorier och värderingar snarare än i vetenskapligt observerade fenomen. För
det andra delger materialet jag studerat få konkreta implementeringsexempel i skolan och de som
delges utgår från formativ bedömning, en metod som förvisso säkrats genom systematiska översikter
och som förfäktas av OECD, men som det är oklart i litteraturen huruvida den prövats genom
specifikt RCTer. Dessa implementeringsfall förefaller också ha bedrivits utifrån en öppen skepsis hos
Levinsson gentemot hela idén med Cochrane-formatet. För det tredje kan inte heller trovärdigheten i
formatet avfärdas rakt av utifrån litteraturens resonemang. Detta av sex skäl; För det första har
undersökandet av Cochrane-formatets framväxt och inre logik visat på relevansen i att beakta att det
tillkom som en metod för att hantera bristen på ändamålsenlighet och trovärdighet i äldre, mer
kvalitativt och kontextuellt bundna former av professionell praktik. För det andra innebär
Skagerströms beskrivning av att MI inte implementerades med krav på konsekvent användande i
Riskbruksprojektet, att det finns en möjlighet att detta föranlett lågt användande som inte framgått i
de utvärderande enkätsvaren. Något som tillsammans med den alternativa evidensen kan förklara
bristen på positiv outcome. För det tredje kan teoretiskt sett Helgessons studerade fas 4-RCT, trots
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
dennes ambitioner att i sin studie frångå den återvändsgränd som utgörs av misstagens sociologi,
ändå formaliseras ytterliggare för att lösa den observerade subjektiviteten. För det fjärde är den
forskningsmiljö som Latour och Wollgar studerat av just den art som Cochrane-formatet uppkom för
att ersätta. För det femte behandlar inte Latour och Wollgar i sitt arbete randomisering, något som
öppnar för möjligheten att randomisering kan frammana objektiva resultat. För det sjätte finns det
något som Latour och Wollgar i kraft av sin pessimism inför vetenskapens förmåga att upptäcka
objektiv kunskap, förefaller ha förbisett; nämligen det objektiva värdet av de intersubjektivt
observerbara produkterna av vetenskaplig aktivitet. I bakgrundsdelen tog jag upp hur Richard
Dawkins invänt mot socialkonstruktionismen genom påståendet att flygplan bygger på vetenskapliga
principer och existerar objektivt. Samma argument bör rimligen vara gällande i relation till den
intersubjektivt observerbara effekten av införandet av Cochrane-formatet, som teoretiskt kan ha
erfarits i anglosaxiska utbildningssystem.
Samtidigt förefaller Cochrane-formatet uppbära ett centralt problem kopplat till detta, som är
synonymt med det summerande resonemang som Latour och Wollgar fört i sin studie och som de
menar är generaliserbart för all vetenskap; d.v.s. att det är svårt att se effekten av formatet på andra
sätt än genom formatets egna kriterier för effekt. Intersubjektiva observationer av effekt tappar
enligt detta resonemang objektiv legitimitet i och med att dessa observationer sker genom
vetenskapsparadigmens egna glasögon. I och med att Cochrane-formatet betraktar kvantifieringar av
lågrelevanta RCT-studier som bedrivits på kvantitativa utbildningsmål, som bevis för positiv effekt, så
sätter det rimligen upp kriterier för denna effekt som saknar adekvat verklighetsanknytning. Detta
varken i förhållande till den heterogena, ickeidealiserade skolkontextens verklighet, eller till de
skandinaviska utbildningsmålens verklighet, där kvantifierbar kunskap blott utgör en del av all den
kunskap och bildning som skolan är tänkt att förmedla. Detta i kombination med att effekter i skolan
tenderar att först kunna utvärderas efter lång tid, förefaller trots allt göra det orimligt att
implementera Cochrane-formatets fynd i svensk skola utan att först beakta dess brister och snäva
fokus. En strikt riktlinjesmodell blir utifrån detta otänkbar. Ironiskt nog aktualiseras också värdet av
kvalitativ metod i och med detta, för att synliggöra de effekter som inte kan synliggöras utifrån
Cochrane-formatets egna kriterier för uppmätt effekt.
Varken Cochrane-formatets positivism eller socialkonstruktionismens relativism förefaller utifrån
ovanstående i sig själva leda fram till konstruktiva evidensdefinitioner. Kvar återstår utifrån
tolkningen av litteraturens sammanvägda resultat, således de förslag till hanterande av
Cochraneformatet och dess alternativs brist på stringens och relevans som Bergmark, Lundström,
Sager, Bohlin och Levinsson föreslår; d.v.s. beaktande av för- och nackdelar med olika evidenstyper.
Som ovan nämnts förespråkar Sager, Bohlin och Levinsson Critical appraisal som en metod för detta.
Mest tydligt förslag på hur detta ska gå till ger Levinsson. Han ser som ovan nämnts det nybildade
skolforskningsinstitutet som en väg framåt och förespråkar att detta bör arbeta för att skapa väl
avvägda systematiska översikter som lärare genom en omstrukturerad lärarutbildning har kompetens
att kunna återbedöma utifrån stegen i Critical appraisal. Samtidigt har Critical appraisal som metod
utifrån Nilsens resonemang ovan visat sig mycket svårbedrivet också i modifierad form, varför det
framstår som oklart huruvida Levinssons förslag kan ses som en direkt och enkel lösning på
problemet.
Sammantaget förefaller debatten om hur utbildningsområdet ska evidensbaseras få fortgå en längre
tid innan de balansakter som föreslås, solidifieras nog för att kunna stå emot det ideologiska och
paradigmatiska tunnelseende som beskrivits i detta arbetes början, och som kommit att utnyttja
balansakternas vaghet för att vinna makt över debatten. Just detta dogmatiska tänkande kring
evidensbegreppet är utifrån fynden i detta arbete rimligen det största hindret för etablerandet av
den evidensbaserade skolan. Utifrån detta är det enligt min mening orimligt i nuläget att se läraren
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
som någon som tjänstemannamässigt ska implementera specifik evidens som ordineras uppifrån i
hierarkin. Hur den evidensbaserade professionalitet som istället bör vara gällande ska kunna
formaliseras utifrån Critical appraisal, trots de höga krav som metoden ställer på tid och kompetens,
är utifrån fynden i detta arbete, en fråga som är av stor vikt för skapandet av den sant
evidensbaserade skolan. Detta bör rimligen föranleda blocköverskridande politiska samarbeten,
tvärvetenskapliga samarbeten mellan de vetenskapsparadigm som behandlats i denna uppsats
liksom tätare kontakter och vagare gränser mellan lärarprofessionen och de utbildningsvetenskapliga
forskarna. På detta sätt kan skolan förhoppningsvis så småningom finna en evidensdefinition som
balanserar metodologisk stringens och praktisk relevans genom professionellt oberoende och en
politisk och vetenskaplig insikt om orimligheten i dogmatiska synsätt på vilka forskningsmetoder som
skolans verklighet kräver.
9. FORTSATT FORSKNING
Detta arbete har behandlat skandinaviska perspektiv på Cochrane-formatets ändamålsenlighet,
implementerbarhet och trovärdighet liksom önskvärda alternativ till detta. Mer sammanställningar
behövs kring hur formatet fungerat i de länder där det varit norm under en längre tid. Detta med
fokus på vad som i dessa länder definieras som positiva utfall samt vad som inte anses som relevanta
faktorer att mäta eller för den delen utforska kvalitativt. Den fortsatta forskningen bör alltså enligt
mina slutsatser kring litteraturen, utgå från den värderingsmässiga skillnaden mellan den
anglosaxiska curriculumtradition och den skandinaviska didaktiktraditionen så som denna skillnad
beskrivits i bakgrundsdelen i detta arbete. Med utgångspunkt i denna skillnad bör fortsatt forskning
bedöma huruvida Cochrane-formatet och annan kvantitativt grundad evidens har objektiva styrkor
som kan komplettera den kvalitativa evidens som krävs för beaktandet av de mjuka värden, så som
demokratifostrandet, som är centrala för den svenska skolan. I förlängningen är det också
nödvändigt att genom forskning försöka utröna i vilken utsträckning vetenskapliga paradigm bär på
filosofiska antaganden om människan som mer tangerar ideologiernas sfär än den allmännyttiga
objektiviteten. En fråga som aktualiseras av de ideologiska syften som olika former av evidens
förefaller vara olika bra på att gynna.
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
10. KÄLLFÖRTECKNING
Litteratur
Latour, Bruno och Wollgar, Steven. 1986. Laboratory life : the construction of scientific facts.
Princeton: Princeton university press
Bohlin Ingemar och Sager, Morten (red). 2011. Evidensens många ansikten : evidensbaserad praktik i
praktiken. Lund: Arkiv förlag
Levinsson, Magnus. 2013. Evidens och existens : evidensbaserad undervisning i ljuset av lärares
erfarenheter. Diss., Göteborgs universitet
Nilsen, Per (red). 2014. Implementering av evidensbaserad praktik. Malmö: Gleerups förlag
Månsson, Per (red). 2007. Moderna samhällsteorier : traditioner, riktningar, teoretiker. Göteborg:
Norstedts akademiska förlag
Skolverket. 2013a. PISA 2012: 15-åringars kunskaper i matematik, läsförståelse och naturvetenskap.
Stockholm: Skolverket
Skolverket. 2013b. Forskning för klassrummet: Vetenskaplig grund och beprövad erfarenhet I
praktiken. Stockholm: Skolverket
Wennström, Johan. 2014. Lärare utan frihet : När vänstern och högern kidnappade lärarprofessionen.
Samhällsförlaget
Lübcke, Poul (red). 2003. Filosofilexikonet: Filosofer och filosofiska begrepp från A till Ö. Stockholm:
Bokförlaget Forum AB
Schantz, Richard och Seidel, Markus (red). 2012. The problem of relativism in the sociology of (scientific) knowledge. Ontos verlag. E-bok.
M. Hessler, Richard. 1992. Social research methods. St Paul: West publishing company
Internetkällor
Skollag 2010:800. http://www.riksdagen.se/sv/DokumentLagar/Lagar/Svenskforfattningssamling/Skollag-2010800_sfs-2010-800/?bet=2010:800#K1 (hämtad
2015-03-19).
Peter Ivarsson
Examensarbete del 1, HT 2014
Ämneslärarprogrammet, Samhällskunskap
2014-12-15
Skolverket. 2014. Evidens, även det en tolkningsfråga?. Skolverket.se.
http://www.skolverket.se/skolutveckling/forskning/didaktik/undervisning/evidens-aven-det-entolkningsfraga-1.216407
Tväråna, Malin. 2015a. ”Forska i arbetet bättre än hemsnickrad fortbildning”. DN Debatt. 3 Januari.
http://www.dn.se/debatt/forska-i-arbetet-battre-an-hemsnickrad-fortbildning/ (hämtad 2015-0319).
Wallberg, Eva och Miljand, Mats. 2015. ”Skolforskningsinstitutet är ett stöd för lärarna”. DN debatt. 5
Januari. http://www.dn.se/debatt/skolforskningsinstitutet-ar-ett-stod-for-lararna/ (hämtad 2015-0319).
Alvesson, Mats. 2015. ”Lärarforskning knappast någon lösning”. DN Debatt. 8 Januari.
http://www.dn.se/debatt/repliker/lararforskning-knappast-nagon-losning/ (hämtad 2015-03-19).
Tväråna, Malin. 2015b. ”Att delta i vetenskapligt underbyggd skolutveckling är inte
`amatörforskning´”. DN Debatt. 9 Januari. http://www.dn.se/debatt/repliker/att-delta-ivetenskapligt-underbyggd-skolutveckling-ar-inte-amatorforskning/ (hämtad 2015-03-19).
Ingvar, Martin, Sturmark, Christer och Wikforss, Åsa. 2015. ”Den postmoderna sanningsrelativismen
leder oss ner i en antiintellektuell avgrund”. DN Debatt. 22 Mars. http://www.dn.se/debatt/denpostmoderna-sanningsrelativismen-leder-oss-ner-i-en-antiintellektuell-avgrund/ (hämtad 2015-0322)
Det är lärarnas fel (podcast). 2014. Avsnitt 12: Forskning säger. Soundcloud.
https://soundcloud.com/det-ar-lararnas-fel/avsnitt-12-forskning-sager (hämtad 2015-03-17).
Levi, Ragnar (red). 2004. Statens beredning för medicinsk utvärderings ordlista
http://www.sbu.se/sv/var_metod/Ordlista/Post.aspx?epslanguage=SV%2cSV
Nilholm, Claes. 2013. ”Det är dags att kritiskt granska John Hattie”. Pedagogiska magasinet. 21 November. http://www.lararnasnyheter.se/pedagogiska-magasinet/2013/11/21/ar-dags-kritisktgranska-john-hattie
Andra källor
Riksdagsdebatt 15/1-2015. Svt Forum. Replikskifte mellan Gustav Fridolin och Jan Björklund (TVProgram). Stockholm: Svt.