Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Linköpings universitet Lärarprogrammet Dualiteternas förbannelse En översikt över evidensproblematiserande litteratur och dess implikationer för utbildningsområdet Peter Ivarsson Examensarbete inom Samhällskunskap, forskningskonsumtion Handledare: Lars Niklasson LIU-IEI-FIL-G--ÅR/xx--SE Institutionen för ekonomisk och industriell utveckling – IEI Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Sammanfattning Föreliggande uppsats behandlar debatten om hur den svenska skolan ska evidensbaseras på bästa sätt. Olika former av evidensdefinitioners lämplighet för tillämpning inom utbildningsområdet utgör således fokus i uppsatsen och undersöks med hjälp av två svenska tvärvetenskapliga antologier, en svensk fenomenologisk doktorsavhandling samt en socialkonstruktionistisk vetenskapssociologisk klassiker. Huvudsakligt fokus läggs på utrönandet av det så kallade Cochrane-formatets lämplighet. Detta som en följd av att dess evidensdefinition förfäktas av OECD, en inflytelserik part i debatten, och att det visat sig vara en populär evidensdefinition hos politiska makthavare, bl. a. i Danmark. Utrönandet av Cochrane-formatets lämplighet för utbildningsområdet inleds genom en redogörelse för hur Cochrane-formatet växt fram som ett svar på bristen på metodologisk stringens inom sjukvården, en brist som äldre metoder, så som registerstudier och klinisk epidemiologi, visat sig inkapabla att hantera. Därefter definieras särarten i Cochrane-formatets evidensdefinition; randomiserade kliniska prövningar och metaanalyser och systematiska översikter av dessa. Dess lämplighet undersöks sedermera utifrån tre lämplighetskategorier; ändamålsenlighet, implementerbarhet och trovärdighet. Undersökningen visar på att betydande problematik föreligger i relation till Cochrane-formatets lämplighet för det svenska utbildningsområdet. Detta främst som en följd av dess reduktionistiska fokus på metodologisk stringens. Uppsatsen redogör för,och problematiserar, efter detta den mångfald av alternativa evidensdefinitioner som uppstått som ett svar på kraven på evidensbaserad praktik. Också denna mångfald av alternativ visar sig uppbära betydande problem. Detta främst som en följd av dess ambivalenta fokus på praktisk relevans. Efter detta undersöks litteraturens förslag på lösningar på Cochrane-formatets reduktionism och ambivalensen i mångfalden av alternativa evidensdefinitioner, vilka visar sig landa i en uppfattning om att problemet ska lösas genom en balansakt mellan metodologisk stringens och praktisk relevans genom modiferade varianter av critical appraisal som möjliggör ett beaktande av för- och nackdelar i den professionella praktiken. I undersökningens sista del undersöks möjligheterna till en sådan balansakt genom beaktandet av forskning kring den sociala konstruktionen av vetenskapliga forskningsresultat. Ur detta framgår att såväl tydliga evidensdefinitioner som balansakter kan vara inkapabla att frammana objektiva utbildningsvetenskapliga faktum. Slutligen diskuteras rimligheten i litteraturens resonemang och följderna av dess begränsningar. Utifrån detta framstår själva idén om konkreta och enkla evidensdefinitioner som den faktor som förhindrar framväxten av den evidensbaserade skolan. Utifrån detta landar uppsatsen slutligen i en slutsats om att det finns ett behov av blocköverskridande politisk enighet i relation till skolan samt tvärvetenskapliga samarbeten mellan forskningsparadigm och yrkesverksamma lärare i syfte att utarbeta möjligheter för lärare att evidensbasera sitt arbete utifrån dess kontextuella förutsättningar, oberoende av de ideologiska och paradigmatiska maktförhållanden som råder. Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Innehållsförteckning 1. INLEDNING........................................................................................................................................... 4 2. BAKGRUND .......................................................................................................................................... 4 3. PROBLEMSTÄLLNING ........................................................................................................................... 8 4. SYFTE ................................................................................................................................................... 8 5. FRÅGESTÄLLNINGAR............................................................................................................................ 8 6. METOD................................................................................................................................................. 9 6.1 AVGRÄNSNINGAR ........................................................................................................................ 10 7. UNDERSÖKNING ................................................................................................................................ 11 7.1 Cochrane-formatets framväxt och definition.............................................................................. 11 7.1.1. Cochrane-formatets problemformulering........................................................................... 12 7.1.2 Från registerstudier till randomiserade kliniska prövningar ................................................ 12 7.1.3 Från klinisk epidemiologi till metaanalyser och systematiska översikter ............................ 14 7.2 Cochrane-formatets ändamålsenlighet, implementerbarhet och trovärdighet i relation till utbildningsområdet utifrån svenska forskningsperspektiv ............................................................... 16 7.2.1 Cochrane-formatets ändamålsenlighet för utbildningsområdet ......................................... 16 7.2.2 Cochrane-formatets implementerbarhet inom utbildningsområdet .................................. 19 7.2.3 Cochrane-formatets trovärdighet i relation till utbildningsområdet ................................... 22 7.3 Önskvärt hanterande av mångfalden av alternativa evidensdefinitioner utifrån svenska forskningsperspektiv ......................................................................................................................... 25 7.3.1 Hantering av alternativa evidenshierarkier genom modifierad critical appraisal ................ 26 7.3.2 Hantering av vidgade och breddade evidensdefinitioner genom modifierad critical appraisal ........................................................................................................................................ 27 7.4 Rimligheten i antagandet om att objektiv evidens existerar utifrån socialkonstruktionistiska forskningsperspektiv ......................................................................................................................... 29 7.4.1 Vetenskapliga studiers trovärdighet som evidens ............................................................... 30 7.4.2. Den sociala konstruktionen av framgångsrika vetenskapsparadigm .................................. 31 7.5.3. Forskningssammanställningars trovärdighet som evidens ................................................. 33 7.5.4 Följderna för strävandet efter objektiv vetenskap ............................................................... 36 8. DISKUSSION OCH SLUTSATS .............................................................................................................. 37 9. FORTSATT FORSKNING ...................................................................................................................... 39 10. KÄLLFÖRTECKNING .......................................................................................................................... 40 Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 1. INLEDNING I debatten om skolan har forskning fått en säregen roll. En podcast vid namn ”Det är lärarnas fel” diskuterade nyligen tendensen hos såväl politiker som andra skolledare, att motivera åtgärder med påståendet ”forskning säger”. Podcasten mynnar ut i ett konstaterande att detta uttryck sällan hänger samman med faktisk vetenskaplig syntesbildning utan desto oftare med diskursiva bilder av verkligheten som man försöker bekräfta i efterhand genom användande av vetenskapliga studier som passar denna verklighetsbild (Det är lärarnas fel, 2014). Anledningen till att så är fallet har av bl. a. Jan Björklund i riksdagens kammare den 15/1-2015, motiverats med att humanvetenskapliga fält är forskningsfält med många diametralt motsatta perspektiv. Vid Gustav Fridolins fråga om rimligheten i att Björklund bortsett från den omfattande mängd remissinstanser som gett förslaget om betyg i årskurs 4 tummen ned, tog Björklund upp det faktuella påståendet som motargument. Något som förefaller innebära att han anser att spelfältet är öppet för att som politiker godtyckligt välja vilka vetenskapliga perspektiv man personligen finner mest rimliga (Svt Forum, 2015). En effekt av legitimerandet av sådana dogmatiska slutledningar på basis av åsikter går att se i ett meningsutbyte i Dagens nyheter (DN) om huruvida läraryrket bör grundas i evidenskonsumerande tjänstemannaskap eller i evidensproducerande professionalitet. I meningsutbytet skildras tre åsikter om hanterandet av utbildningsvetenskapens osäkra grunder som förefaller ha blivit förhärskande; En lärare som argumenterar för att forskning måste bedrivas av eller i nära samarbete med lärare i den praktiska verksamheten (Tväråna, 2015a samt Tväråna, 2015b), en akademiker som argumenterar för att bara yrkesforskare är kapabla att frammana bra forskning (Alvesson, 2015) samt det nybildade skolinstitutet som argumenterar för en kombination av bruk av systematiska översikter upprättade av yrkesforskare och professionellt lärarinflytande över forskningsprocessen (Wallberg och Miljand, 2015). Samtidigt som rena åsikter kommit att prägla den vetenskapliga debatten om skolan i Sverige så har en stärkt anglosaxisk vetenskapsdiskurs´ forskningsfynd och teoretiska utgångspunkter kommit att användas som verktyg för att legitimera den politiska maktens åsikter. Specifika former av kvantitativ mätning av skolresultat har således kommit att spela en stor roll i debatten, däribland olika former av internationella prov och forskningssammanställningar där i synnerhet PISA-undersökningen har figurerat flitigt i den skolpolitiska retoriken på nationell nivå medan Hatties massiva metanalysöversikt har kommit att få stort genomslag inom kommunal skolpolitik (Nilholm, 2013). I samband med att denna typ av forskning har fått stort politiskt genomslag så har idéer om så kallad evidensbaserad praktik angetts som ett rationellt sätt att strukturera skolverksamheten, bl.a. i strikt enlighet med den anglosaxiska vetenskapsdiskursens forskningsläge. Något som bl. a. föranlett fokus på formativ bedömning i skolan. OECDs dotterorganisation CERI har aktivt pressat medlemsländer att anamma det så kallade Cochrane-formatets strikta evidensdefinition, vilken beskrivs nedan, och i Danmarks fall principiellt lyckats väl med detta för att sedan se det danska skolinstitutet falla till föga för de danska skolforskarnas annorlunda syn på evidensbegreppet (Levinsson, s. 55 samt Sager och Bohlin, 2011, s. 192f). Frågor har i detta väckts, dels kring implikationerna av att idéerna som Cochrane-formatets evidenshierarki bygger på är resultatet av en övergripande positivistisk evidensrörelses reduktionistiska strävanden efter universellt giltig kunskap på kvantitativ grund. Dels kring implikationerna av att mångfalden av alternativa evidensdefinitioner istället förefaller delge vaga och relativa svar på komplexa problem inom utbildningsområdet. 2. BAKGRUND Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Debatten om vad som utgör en lämplig evidensdefinition för utbildningsområdet förefaller bottna i spänningsfältet mellan positivism respektive skepticism och relativism, diametralt motsatta kunskapsteorier vilkas portalgestalter kan sägas vara Kurt Godel respektive David Hume och Protagoras. Medan positivismen utgår ifrån att objektiv kunskap inte bara finns utan dessutom kan generaliseras, så menar skepticismen och relativismen tvärtom att all kunskap är subjektiv och relativ till olika kontexter (Lübcke, 2003, s. 241f, 440, 449, 467, 509f samt Hessler, 1992, 13-17). Dessa kunskapsteorier har i sin tur kommit att aktualiseras genom framväxten av två separata forskningstraditioner; kvantitativ och kvalitativ metod. Konflikter finns mellan traditionerna i relation till huruvida kvantitativt uppmätta och/eller statistiskt säkerställda kausalsamband, vad jag väljer att kalla reduktionistisk stringens, är definitionen av god vetenskap eller huruvida kvalitativ förståelse för det kontextuella sammanhanget, vad jag väljer att kalla ambivalent relevans, är det. Debatten har också kommit att tangera konflikten mellan naturvetenskapen, där kvantitativa metoder framgångsrikt använts för att identifiera stringens mellan observationer, och samhällsvetenskapen där i synnerhet sociologin i huvudsak använt sig av kvalitativ metod för att identifiera kontextuellt relevanta förklaringsmodeller (Hessler, 1992, s. 53f samt Bohlin, 2011, s. 19ff). Disciplinmässigt kan konstruktionismen sägas vara den mest relativistiska vetenskapsteoretiska riktningen inom det kvalitativa forskningsparadigmet, något som förvisso ifrågasatts inom konstruktionismen även i relation till den kontroversielle Bruno Latours vittgående teoribildning (Schantz och Seidel, 2012, s. 106f, 123) men som rimligen bekräftas av konstruktionismens syn på kunskap som konstruerad och relativ till olika kontexter (Månsson, 2007, s. 73-83, 213). Bl. a. fysikern Alan Sokal och biologen Richard Dawkins har varit starka motståndare till konstruktionismens idéer. Sokal manifesterade detta genom att få en påhittad konstruktionistisk forskningsartikel om kvantgravitation publicerad i en ansedd konstruktionistisk tidsskrift vilken han sedermera kritiserade för kriterielöshet. Dawkins har i sin tur drivit argumentet att förekomsten av vetenskapliga produkter, t ex flygplan, är ett bevis för att det är möjligt att sätta upp vetenskapliga forskningskriterier och därigenom producera objektivt existerande resultat av dessa (Schantz och Seidel, 2012, s. 34, 34 fotnot, 106 samt Månsson, 2007, 215f). Kritiker på den kvalitativa sidan förefaller ha funnit sitt främsta vapen i den socialkonstruktionistiska vetenskapssociologin och dess synliggörande av naturvetenskapens dolda subjektivism, något som framgår av Latour och Wollgars studie, vilken behandlas i detta arbete. I en svensk kontext delger Jan Björklunds medlöpare i propagerandet för införandet av betyg i årskurs 4, läkarprofessorn Martin Ingvar, perspektiv på detta. Detta tillsammans med förbundet Humanisternas ordförande Christer Sturmark och filosofiprofessorn Åsa Wikforss, i en debattartikel i DN den 22/3-2015, där de tre vänder sig mot en upplevt utbredd kunskapsrelativism inom akademin i relation till bl. a. pedagogik. I detta framställs i synnerhet socialkonstruktionistiska perspektiv på naturvetenskap som ett problem som de menar i förlängningen riskerar att upplösa fundamenten för god moral och kunskap i samhället. Relativismen hos lärosätena menar de också innebär att grunden för legitimerandet av akademiska yrken urholkas (Ingvar, Sturmark och Wikforss, 2015). Bruno Latour har intressant nog själv uttryckt en rädsla för denna möjlighet, Han menar att klimatförnekare och konspirationsteoretiker kommit att använda relativism och konstruktionism för att förfäkta verklighetsuppfattningar som är objektivt dåliga för mänskligheten på ett oroväckande sätt (Schantz och Seidel, 2012, s. 127). Medan de inslag av positivism och relativism som förekommer i den svenska skoldebatten har djupa vetenskapsfilosofiska rötter, så har debatten mellan det kvantitativa och det kvalitativa forskningsparadigmet kommit att aktualiseras av pragmatiska skäl i och med tillkomsten av så kallad New public management (NPM). Detta i synnerhet i relation till vården och skolan. New public management är namnet på moderna idéer om att effektiviteten i den skattefinansierade offentligheten ska garanteras genom olika former av standardisering, utvärdering och kontroll. I detta har dokumentation och så kallad evidensbaserad praktik setts som lösningar för att säkerställa Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 kontroll över den mänskliga faktorn. Något som också lett fram till formerandet och spridandet av så kallad evidensbaserad medicin (Wennström, 2013, s. 11ff samt Bohlin, 2011, s. 14). Möjligheterna att formalisera verksamheter i enlighet med NPM är avsevärt större genom bruk av kvantitativ metod. Det är dock också rimligen som en följd av naturvetenskapens och det kvantitativa forskningsparadigmets höga ställning i jämförelse med samhällsvetenskapen och det kvalitativa forskningsparadigmet, som vi ser ökade drivkrafter, bl. a. pådrivet av organisationer som OECD, för att få den svenska skolan att tillämpa den så kallade evidensrörelsens definition av evidensbaserad praktik, vilken grundar sig i dessa paradigm. Evidens som begrepp är i sin ursprungliga betydelse obestridliga bevis (Levinsson, 2013, s. 15). För den så kallade evidensrörelsen, d.v.s. de intressenter som arbetar för att överföra den anglosaxiska normen för evidensbaserad praktik till norden och kontinenten, är som framgår nedan idén om obestridliga bevis tätt sammankopplad med kvantitativa forskningssammanställningar på experimentell grund. Idén med den evidensbaserade praktiken, såsom evidensrörelsen tänkt sig denna, är således att råda bot på det gap som föreligger mellan användningen av denna typ av forskningsresultat och tillämpningen av dessa i praktisk verksamhet (Nilsen, 2014, s. 15). Idén har intressant nog markanta likheter med den effektivitetsforskning som fick sin höjdpunkt i Sverige på 50- och 60-talen, och som då kom att få betydelse för utbildningsområdets strukturering. Effektivitetsforskningen kom från USA, var en reaktion på den humanvetenskapliga forskningstraditionens upplevda flummighet och delgav som lösning på skolans frågor formaliserade program, manualer och modeller utifrån den positivistiska behaviorismens experimentella forskningsresultat. Forskningen övergavs i Sverige till förmån för Donald Schöns idéer om reflekterande praktiker; en modell där läraren sågs som aktivt deltagande i utforskandet av fungerande metoder och tillvägagångssätt i skolan. Detta vid insikten om att effektivitetsforskningen gav föga goda resultat och dessutom reducerade skolans komplexa verksamhetsområde till en arena för teknisk rationalitet. Reflektionsrörelsen i kombination med Michael Polyanis idéer om lärares tysta kunskaper bidrog således till att återigen temporärt skifta pendeln åt det kvalitativa hållet (Levinsson, 2013, s. 19f). Inom utbildningsområdet har inte bara frågan om olika former av evidensdefinitioners trovärdighet, utan också olika former av evidensdefinitioners ändamålsenlighet och implementerbarhet kommit att resultera i infekterade konflikter. Detta som en följd av de väsentligt åtskiljda formerna av kunskapsdefinitioner som föreligger mellan anglosaxiska länder och andra länder i relation till evidens (Sager och Bohlin, 2011, s. 197). Dessa disparata kunskapsideal, vilka i relation till utbildningsområdet kan kategoriseras som anglosaxiska curriculumtraditioner och nordiska didaktiktraditioner, har frammanat distinkt åtskiljda perspektiv på vad som är ändamålsenlig vetenskap för skolan. Perspektiven skiljer sig teoretiskt åt som en följd av olika former av skolsituationer. Medan USA har saknat en central läroplan och därför behövt att lägga stort fokus på att genom nationella prov utvärdera olika delstaters konkreta ämneskunskaper, har det i exempelvis Sveriges fall kunnat läggas betydligt mer fokus på den övergripande bildningen av eleven som samhällsmedborgare och därmed också olika abstrakta, relativa värden (Levinsson, 2013, s. 20). Utvecklingen av idéer om evidensbaserad utbildning sägs i sin tur ha sin grund i ett föredrag som David Hargreaves höll år 1996 på Teacher Training Agency i London. Han menade i detta att läraryrket i sin dåvarande form, inte var forskningsbaserat i och med att den pedagogiska forskningen saknade kvalitet, relevans och var för fragmenterad för att ackumuleras på ett konstruktivt sätt. Följden av detta menade Hargreaves hade blivit ett utbildningssystem där vanor och traditioner snarare än vetenskap präglade verksamheten (Levinsson, 2013, s. 25). Flertalet initiativ har sedan dess tagits i de anglosaxiska länderna för att etablera sätt att evidensbasera utbildningssystemen. I Storbritannien bildades år 2000 organisationen Evidence for Policy and Practice Information Coordination Centre (EPPI), i syfte att skapa systematiska översikter till utbildningsområdet. Parallellt Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 med bildandet av EPPI, initierades också programmen ”Best Practice Research Scholarship” och ”the Teaching and Learning Research Programme” i syfte att öka användandet av forskning i brittiska skolor. I USA upprättades år 2001 ”No Child Left Behind”-act vilken syftade till att ge delstaterna ansvar för elevernas måluppfyllnad och att bl. a. undervisningen bedrevs på vetenskaplig grund. Året därpå etablerades organisationen What Works Clearinghouse (WWC) i syfte att göra RCTer till norm för undersökningar om effektiva metoder i utbildningssystemet (Levinsson, 2013, s. 25f). Brittiska Campbell-samarbetet, en systerorganisation till det så kallade Cochrane-samarbetet, och WWC anses ha varit drivande i att överföra EBMs typ av systematiska översikter till utbildningsområdet (Levinsson, 2013, s. 29f). Centrum för utbildningsforskning och innovation (CERI), är en del av OECD som varit drivande i denna utveckling. CERI är ett medlemsgrundat program för granskning och identifiering av trender inom utbildningsområdet samt granskning av medlemsländers forskningsoch utvecklingssystem (FoU-system), i syfte att genom denna verksamhet värna om forskning och innovation samt transparens och ömsesidiga påverkansmöjligheter mellan länder. FoUgranskningarna studerar olika länders kapacitet till insamling, utveckling och spridning av för utbildningsområdet relevant kunskap till detta områdes yrkesverksamma. Föga förvånande menar CERI att denna verksamhet fungerar dåligt i de flesta länder i och med en svag vetenskaplig grund. USA och Storbritannien är undantaget denna bedömning och anses snarare normerande (Levinsson, 2013, s. 27f). Ett belysande möte mellan det anglosaxiska och det skandinaviska perspektivet på utbildning ägde sedermera rum på en konferens i Washington anordnad av CERI, år 2004. På konferensen uppstod en hätsk debatt mellan den danska delegationen och amerikanska RCT-anhängare angående huruvida evidensbegreppet bör vidgas eller ej. Den danska ståndpunkten att mer än RCTer är att betrakta som evidens väckte här missnöje. I samband med mötet hade OECD efter en utvärdering av landets utbildningsforskning utfärdat en rekommendation till Danmark om att skapa en organisation i stil med amerikanska WWC eller brittiska EPPI, vilken är mer metodologiskt pluralistisk än WWC, och som bl. a. inkluderat kvalitativa studier sammanställda genom nya former av metoder för skapandet av systematiska översikter, såsom narrativ begreppsanalys och metaetnografi, samt systematiska översikter tänkta att besvara de för RCTer svåra frågorna om vilken undervisningsmetod som fungerar för vem och i vilket sammanhang. I dessa systematiska översikter har så kallade ”viewstudies” och experimentella studier kombinerats för att uppnå den önskade relevansen (Sager och Bohlin, 2011, s. 191ff samt Levinsson, 2013, s. 31). I CERIs expertgrupp satt vid tillfället för granskningen av Danmark, David Hargreaves, vilkas uppfattningar om utbildningsområdets vetenskapliga status behandlats ovan (Levinsson, 2013, s. 28). Trots det motstånd inifrån utbildningsforskningen som visade sig på konferensen, och troligen som en följd av CERIs hårda omdömen, valde de danska undervisnings- och vetenskapsdepartementen att tillsammans med Danmarks Paedagogiske Universitet, utforma ”Dansk Clearinghouse for Uddannelses-forskning” med tre förebilder som alla utgår från Cochrane-formatet; Cochranesamarbetet, Campbellsamarbetet och WWC (Sager och Bohlin, 2011, s. 192). De danska utbildningsforskarna var mycket kritiska, bl. a. som en följd av upplevelsen att Cochrane-formatet inte var förenligt med de traditionella verksamhetstyper som redan etablerats, d.v.s. processutvärdering i syfte att förbättra/vidareutveckla pedagogiska grepp parallellt med att dessa används. Resultatet av detta har blivit att kriterierna för de systematiska översikter som skulle vara ledande för arbetet i skolverksamheten, breddats till att innefatta kvantitativa och kvalitativa primärstudier och flera former av syntetisering (Sager och Bohlin, 2011, s. 192f). I Danmark har alltså etablerandet av evidensbaserad praktik skett genom institutionell press för att sedan nyanseras i praktiken och anpassas till de nationella traditionerna och intressekonflikterna (Sager och Bohlin, 2011, s. 193ff). En breddning som sedermera ägt rum inom flera verksamhetsområden (Levinsson, 2013, s. 31) och resulterat i en betydande mångfald av alternativa evidensdefinitioner. Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 I Sverige har utvecklingen varit mer subtil och grundad i implikationer om behovet av införandet av evidensbaserad praktik inom utbildningsområdet. Problematiska resultat i tester avsedda för kvantitativa jämförelser i skolprestationer mellan länder, såsom TIMSS och PISA, har i kombination med de ökade krav på effektivitet som New public management medfört (Skolverket 2013a, s. 148 samt Wennström, 2014, s. 11) skapat drivkrafter för att införa vetenskapliga principer som enligt världsomspännande organisationer håller hög kvalité. Införandet av formativ bedömning på bred basis har exempelvis sin grund i systematiska översikter rekommenderade av OECD i egenskap av stora uppmätta effektstorlekar (Levinsson, 2013, s. 16f samt 35). Utifrån detta förefaller det tydligt att det är Sveriges tur att möta trycket från evidensrörelsen om att införa Cochrane-formatet i svensk skola. 3. PROBLEMSTÄLLNING I tider då skolan på ett synligt sätt förväntas befinna sig i vetenskapens verifierade frontlinjer är det problematiskt att det inom utbildningsvetenskapen råder konflikter om på vilka grunder avanceringen fram till denna frontlinje ska äga rum. Anledningen till att detta är ett problem är tredelad. Dels öppnar det upp för att ideologiska ståndpunkter och paradigmatisk makt ersätter objektiva vetenskapsideal. Dels urholkar det läraryrkets kapacitet till anspråk på objektiv vetenskaplighet och därmed också dess status som profession. Dels blir det också svårt att avgöra huruvida maktbalansen inom forskningsfältet eller den enskilde lärarens professionella bedömning ska vara normerande för vilken typ av evidens som tillämpas i praktiken. Om läraren förväntas utföra sitt praktiska arbete i enlighet med Skollagens proklamation att ”Utbildningen ska vila på vetenskaplig grund och beprövad erfarenhet (Skollagen, 2010, kap 1, §5) så krävs det rimligen att den vetenskapliga grunden är stabil. Och inte bara stabil utan också uppbärandes en vetenskap som är trovärdig och implementerbar och som ger önskvärda, ändamålsenliga resultat. I detta uppstår frågan hur ändamålsenligt, implementerbart och trovärdigt Cochrane-formatet är, som CERI i nuläget aktivt försöker ge högt anseende också inom skandinavisk utbildningsvetenskap. Vidare frågor är hur legitima argumenten mot denna lämplighet är liksom hur legitima förslagen på alternativa evidensdefinitioner och balansakter är. Frågor vars svar bör vägleda en slutsats kring lärarens lämpliga roll i relation till den evidens som ordineras uppifrån. 4. SYFTE Syftet med denna uppsats har varit att utforska spänningsfältet mellan strikta och lösa evidensdefinitioner i relation till deras respektive polers lämplighet för utbildningsområdet, samt lämpliga sätt att hantera dessa spänningar och den pluralism av definitioner som uppstått som en följd utav dem. Detta i ljuset av evidensdefinitionernas grund dels i olika syn på kunskap och dels i olika kvantitativa och kvalitativa vetenskapsparadigm som konkurrerar med varandra om rätten att få definiera fullgod evidens. Ambitionen har varit att utifrån denna undersökning få en bild av huruvida det är lämpligt att se läraren som tjänsteman, tillika okritisk tillämpare av den evidensdefinition som vunnit politikers och andra beslutsfattares gunst, eller som professionell utrönare av olika evidensdefinitioners ändamålsenlighet, implementerbarhet och trovärdighet i relation till olika uppgifter i skolverksamheten. 5. FRÅGESTÄLLNINGAR 1. Hur har Cochrane-formatet växt fram och vad är dess definition? Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 2. Hur ändamålsenligt, implementerbart och trovärdigt är Cochrane-formatet i relation till utbildningsområdet utifrån svenska forskningsperspektiv? 3. Hur ska mångfalden av alternativa evidensdefinitioner som uppstått hanteras utifrån svenska forskningsperspektiv 4. Hur rimligt är antagandet om att objektiv evidens existerar utifrån socialkonstruktionistiska forskningsperspektiv? 6. METOD Vid utformandet av mina forskningsfrågor och vid urvalet av litteratur utgick jag från hypotesen att förutsättningarna för evidensbaserad praktik i svensk skola är oklart definierade och därför behöver utrönas. Utifrån detta har jag letat efter litteratur som uppburit relevans dels för ämnet evidensbaserad praktik och dels för den svenska skolkontexten. Jag har också funnit det relevant att finna litteratur som ger en övergripande bild av problemområdet då jag upplever det som ett område som är komplext och som det således är svårt att dra slutsatser om utan att ha en ordentlig översikt över dess särart och dess implikationer för den svenska skolan. Denna översiktliga förståelse försöker jag således också etablera hos läsaren av detta arbete så att denne till fullo ska förstå den studerade kontexten. Fyra böcker har utifrån detta blivit urvalet vilka behandlar såväl evidensbegreppets tillväxt och nuvarande status, liksom resonemang och forskning som problematiserar det; två tvärvetenskapliga svenska antologier, en fenomenologisk, svensk doktorsavhandling samt en socialkonstruktionistisk vetenskapssociologisk klassiker. Magnus Levinssons fenomenologiska doktorsavhandling har jag upptäckt är en källa till kunskap om evidens i Skolverkets publikationer. I dessa förekommer också Morten Sager och Ingemar Bohlins antologi (Skolverket, 2013, s. 12 samt Skolverket, 2014). De undersökta böckerna hittade jag dels genom användandet av sökord så som ”evidens” och ”evidensbaserad praktik” i Unisearch, och dels genom att direkta titlar av besläktad art angetts i den litteratur jag tagit del av. Läsningen av den svenska litteraturen har lett fram till att jag har identifierat Cochrane-formatet som kärnan i den vetenskapliga grund som evidensrörelsen önskar föra över från medicinens område till det skandinaviska utbildningsområdet. Som en följd av detta har jag försökt att med hjälp av böckerna inringa innebörden av Cochrane-formatet samt vilken typ av kritik mot det som litteraturen lyfter fram. Fynden utifrån detta har i sin tur resulterat i att jag funnit kritik som jag upplevt kunnat delas in i tre lämplighetskategorier; ändamålsenlighet, implementerbarhet och trovärdighet. För att nyansera arbetet har jag också valt att studera den svenska litteraturens beskrivningar av mångfalden av alternativa evidensdefinitioner som uppstått, dess lämplighetsproblem samt litteraturens förslag på slutgiltiga lösningar. Dessa tre böcker knyter i huvudsak an till implementeringsforskning, ett statsvetenskapligt forskningsfält. Den fjärde boken jag valt att använda är istället en vetenskapssociologisk klassiker som problematiserar huruvida strävandet efter evidensbaserad praktik alls är ett realistiskt förehavande. Identifikationen av definitionen av bokens särart har jag åstadkommit med hjälp av Per Månssons bok Moderna samhällsteorier. Att jag valt att använda denna vetenskapssociologiska klassiker beror på att den möjliggör en logisk slutpunkt för den övergripande röda tråden i detta arbete, vilken kan sägas behandla den balansgång mellan positivism och relativism som präglar debatten om lämpliga evidensdefinitioner i relation till utbildningsområdet, vilket framgått av bakgrunden. Läsaren är tänkt att tematiskt föras från beskrivningen av Cochrane-formatets positivistiska logik, där metodologisk stringens står högt i kurs, genom bevisen för denna logiks olämplighet för utbildningsområdet, fram till den pluralistiska vaghet som uppstått i strävandet efter kontextuellt relevanta evidensdefinitioner för utbildningsområdet och slutligen över i den socialkonstruktionistiska vetenskapssociologins relativistiska logik, där såväl Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 stringens som relevans ses som illusioner. Boken refereras av Claes-Fredrik Helgesson i dennes kapitel i Sager och Bohlins antologi och uppbringar också likartade resonemang som förekommer i dennes kapitel. Intressanta likheter har vid läsningen av boken också visat sig förekomma mellan de metoder som i denna studerats och i synnerhet logiken bakom systematiska översikter, vilket ytterliggare stärkt min uppfattning om dess relevans för problemområdet. Varken RCTer eller systematiska översikter är dock metoder som beskrivs uttalat i boken p.g.a. dess ålder. Samtidigt behandlar boken vetenskapliga studier och forskningssammanställningar i allmänhet och utgör därför en möjlighet att få generella perspektiv på olika forskningsmetoders förmåga att frammana objektiv evidens. I relation till denna bok har jag valt att översätta begreppen ”credibility” och ”statements” till ”trovärdighet” och ”påståenden” för att tydliggöra resonemangen. Jag reserverar mig för att i synnerhet innebörden i begreppet ”credibility” kan bli lidande som en följd av detta i och med den mångfald av betydelser som föreligger i det engelska språket. För att förenkla för läsaren har jag valt att referera sammanhang där Cochrane-formatets evidensdefinition omnämns som just ”Cochrane-formatet”, i enlighet med Levinssons benämning på detta i sin doktorsavhandling (Levinsson, 2013, s. 29f). Detta trots att de olika författarna i litteraturen har valt att kalla denna evidensdefinition för olika saker. Det jag avser med Cochraneformatet är de tre delar som litteraturen förefaller definiera som den evidensbaserade medicinens, EBMs, guldstandarder; Randomiserade kliniska prövningar och metaanalyser och systematiska översikter av dessa. Guldstandarder som utgör kärnan i den evidenshierarki som evidensrörelsen försökt föra över till utbildningsområdet (Nilsen, 2014, s. 46, 228 samt Levinsson 29ff). I kapitel 3 i Per Nilsens antologi presenterar denne en evidenshierarki som utgår från denna modell vilken kan beskådas nedan. 6.1 AVGRÄNSNINGAR Anledningen till mitt val av fokus grundar sig som ovan nämnts i huvudsak i min upplevelse av att det är relevant att såväl jag själv som läsaren förstår logiken bakom Cochrane-formatets framväxt och särart, dess brister och dess alternativ i relation till den svenska skolkontexten, innan slutsatser kan dras om dess potentiella funktion för den svenska skolan. Denna upplevelse har medfört ett behov av att låta omfattande och övergripande svensk litteratur utgöra källmaterial istället för enskilda forskningsartiklar. Rent tids- och omfångsmässigt har jag inte upplevt att jag haft möjlighet att kombinera detta strävande efter förståelse med redogörelser för hur dess tillämpningar i skolan fallit ut internationellt, där sådana exempel finns att hämta. Som en följd av detta har fokus legat mindre på konkreta implementeringsexempel och mer på en förståelse för formatets och dess alternativs förutsättningar. Således bör min skildring av Cochrane-formatet, dess inre motsättningar och dess alternativ, inte ses som representativ för en uttömmande beskrivning av Cochrane-formatets lämplighet inom utbildningsområdet, utan snarare som en översikt över tvärvetenskapliga svenska, respektive vetenskapssociologiska, perspektiv på detta, vilka förvisso till stor del bottnar i internationella källor men ändå inte kan ses som uttömmande i kraft av det ovan nämnda. De studerade perspektiven är också ensidigt kritiska till Cochrane-formatet. Anledningen till detta hänger samman med att samhällsvetenskaplig forskning om ämnet till övervägande del antar ett sådant kritiskt förhållningssätt, något som också Sager och Bohlin konstaterat (Sager och Bohlin, 2011, s. 15). I förhållande till litteraturen har delar som varit perifera för frågeställningen sållats bort. Däribland delar som behandlar implementeringen av olika former av evidens inom specifikt sjukvården, ett i huvudsak naturvetenskapligt område där psykosociala faktorer, så som är centrala inom exempelvis socialt arbete och utbildning, är underordnade medicinska sådana. I Sager och Bohlins antologi har Sagers och Karin Fernlers respektive kapitel sållats bort av detta skäl. I Nilsens antologi har en större Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 mängd kapitel också sållats bort. Kapitel fyra till åtta behandlar implementeringsforskningens teori och metod och har därför ansetts perifera för detta arbetes mer översiktliga fokus. Kapitel nio till tolv i antologin behandlar samtliga sjukvårdsimplementering av olika former av evidens och har således av skälen som angetts ovan sållats bort. Kapitel 15 behandlar slutligen utbildning av restaurangpersonal utifrån odefinerad forskningsgrund, varför jag bedömt det vara oanvändbart för att besvara min frågeställning. Att så många kapitel faller bort ur antologierna är en följd av att Cochrane-formatet i huvudsak fått genomslag inom just medicinens område i Sverige medan det i relation till utbildningsområdet och besläktade verksamhetsområden ännu förefaller vara sparsmakat med tydliga implementeringsexempel. Levinssons avhandling och Bergmark och Lundströms kapitel i Sager och Bohlins antologi behandlar dock konkreta sådana exempel, liksom i viss mån Skagerströms kapitel i Nilsens antologi. Hansen och Riepens kapitel i Sager och Bohlins antologi bidrar också med exempel på detta men utifrån en dansk kontext. Dessa delar av materialet bör därför ses som komplement till de resonemang som den svenska litteraturen i övrigt för kring ämnet implementering. Med detta sagt utesluts dock inte skildringen av Cochrane-formatet i relation till sjukvård och andra naturvetenskapliga discipliner. Helgessons kapitel i Sager och Bohlins antologi liksom Bruno Latour och Steven Wollgars klassiska laboratoriestudie används bl. a. för att få grepp om Cochraneformatets trovärdighet, vilken till skillnad från ändamålsenligheten och implementerbarheten är oberoende av den vetenskapliga kontext som den yttrar sig i. Avgränsningen sätter alltså Ceris förfäktande av Cochrane-formatet, och den behandlade litteraturens förfäktande av alternativ till detta, i skottgluggen och möjliggör därmed en avstampsmöjlighet för framtida, mer breddade studier om vilken typ av evidensdefinition som är lämplig för utbildningsområdet i Sverige. Detta utifrån den grundläggande polemik mellan positivism respektive skepticism och relativism som präglar evidensdebatten. 7. UNDERSÖKNING 7.1 Cochrane-formatets framväxt och definition Med Cochraneformatet avses i detta arbete som ovan nämnts de guldstandarder som kommit att bli norm inom evidensbaserad medicin (EBM) i Sverige; randomiserade kliniska prövningar och metaanalyser och systematiska översikter av dessa. Per Nilsen har i sin antologi exemplifierat en evidenshierarki i enlighet med denna modell (Nilsen, 2014, s. 47) vilken visas nedan. Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Figur 1 Exempel på Cochraneinfluerad evidenshierarki inom EBM (Nilsen, 2014, s. 47) Nedan redogörs för den problemformulering som ligger bakom Cochrane-formatet, dess utveckling över tid och dess nuvarande form. Cochrane-formatet är tänkt som ett recept för att skapa hård vetenskap inom komplexa verksamhetsområden. För att förstå grunden för CERIs iver att införa Cochrane-formatet inom utbildningsområdet, är det initialt nödvändigt att redogöra för det påfunna problem som utformandet av Cochrane-formatet bottnar i. 7.1.1. Cochrane-formatets problemformulering Läkaren Archie Cochrane fick som krigsfånge under andra världskriget arbeta som läkare. Vid vårdandet av patienter i krigsfångenskapen tvingades Cochrane att bortse från många formaliserade praktiker som inom reguljär medicin ansågs nödvändiga. Han upptäckte då att många av dessa formaliserade praktiker saknade funktion i praktiken och att patienter som nekats viss behandling således ändå klarade sig. Upptäckten föranledde att Cochrane efter kriget bedrev en regelrätt undersökning under vilken han kom att finna att 95% av alla förespråkade åtgärder inom medicinen saknade vetenskapligt underlag (Sager och Bohlin, 2011, s. 10). Cochrane skrev senare i livet en bok vid namn ”Effectiveness and Efficiency” i vilken han menade att de fynd han gjort ställde krav på rättvisare fördelning inom sjukvården på basis av vetenskapligt verifierade effekter. En slutsats som är i enlighet med argumenten för New public management (Wennström, 2014, s. 12f). Året innan sin död definierade också Cochrane två av EBMs kommande gold standards; Randomiserade kliniska prövningar (RCTer) och metaanalyser, som det som borde normera denna fördelning. Han motiverade det hela med de fynd som gjorts i en studie om graviditet utifrån dessa premisser. Genom detta brukar Archie Cochrane ses som evidensrörelsens grundare (Levinsson, 2013, s. 23). 7.1.2 Från registerstudier till randomiserade kliniska prövningar Innan tillkomsten av randomiserade kliniska prövningar ansågs registerstudier vara ett gångbart sätt att säkerställa att klinisk praktik var vetenskapsgrundad. Registerstudier är en typ av statistisk Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 sannolikhetsforskning som tillkom som en följd av att läkaren John Wennberg på 1980-talet genom sina efterforskningar upptäckte avsevärda variationer mellan olika vårdinrättningars kliniska praktik. Initialt försökte man i USA råda bot på det av Wennberg påfunna problemet genom upprättandet av nationella register där diagnoser, behandlingsmetod, eventuella komplikationer och mortalitetsfrekvens kartlades. Utifrån dessa så kallade registerstudier (på engelska outcomes research) kunde sedermera kliniska riktlinjer upprättas i relation till den statistiska sannolikhet för olika utfall som registerstudier visade. Något som i sin tur öppnade upp för utkrävande av ansvar från lokala praktiker (Nilsen, s. 23-27). Sverige hade år 2009 som en följd av denna utveckling 77 nationella kvalitetsregister av den här typen som förvaltades av Sveriges Kommuner och Landsting (SKL) (Sager och Bohlin, 2011, s. 51). En konflikt uppstod successivt mellan förespråkare för så kallade randomiserade kliniska prövningar, ofta i litteraturen förkortade RCTer, och förespråkare för registerstudier. Konflikten handlade om huruvida RCTer i kombination med praktikbunden så kallad Critical appraisal vilken behandlas nedan, eller registerstudier gav högst nivå av extern validitet. Kritiken som riktats mot de upprättade registerdatabaserna är i huvudsak omöjligheten att i dessa veta huruvida den korrekta variabeln, d.v.s. själva behandlingen av patienten, haft ett direkt kausalsamband med variablerna komplikationer och mortalitet. Registerstudier har i detta betydligt mindre metodologisk stringens än RCTer. Bl. a Adam Taube, professor i medicinsk statistik har drivit denna kritik i Sverige (Sager och Bohlin, 2011, s. 53). Uppkomsten av RCTer kan utifrån detta ses som ett svar på de så kallade registerstudiernas oförmåga att identifiera direkta kausalsamband. Den så kallade McMastergruppen, initierad av anställda på medicinska fakulteten på McMaster university, var en central kraft i utformandet av EBM i enlighet med Archie Cochranes idéer kring detta. De drev liksom Cochrane starkt tesen att RCTer bör vara vetenskapsnorm (Sager och bohlin, 2011, s. 39f samt Nilsen, 2014, s. 28f). McMaster-gruppens intresse för att snarare än att beakta laboratoriegrundad kunskap eller registerbundna sannolikheter som pekade på potentiella kausalsamband, kartlägga direkta kausalsamband, ledde fram till att RCTer, i enlighet med Archie Cochranes vilja, kom att bli deras definition av evidensbegreppets ”golden standard”. En metod som sedermera kommit att bli normerande för EBM i sin helhet (Nilsen, 2014, s. 29, 34 samt Sager och Bohlin, 2011, s. 14, 69f). Randomiserade kliniska prövningar har fått sitt namn som en följd av att de slumpmässigt fördelar testsubjekt mellan kontrollgrupp och experimentgrupp på ett sätt som eliminerar okända störningsfaktorer. Idealt ska detta ske enligt den så kallade double eller triple blind-principen där deltagare, utförare, och i det senare fallet också utvärderares, kännedom om grupptillhörighet och experimentstruktur elimineras (Nilsen, 2014, s. 47). Experimentgruppen delges sedermera den typ av läkemedel som ska evidensprövas medan kontrollgruppen gives placebo. Sedermera manipulerar forskaren oberoende variabler som anses ha en kausal effekt på en beroende variabel, allt i syfte att upptäcka tydliga kausalsamband i experimentsituationen (Nilsen, 2014, s. 46f). RCTer präglas alltså av regelstyrt genomförande under mycket kontrollerade former (Sager och Bohlin, 2011, s. 73) och har således hög intern validitet. Detta innebär att man under de ideala förutsättningar man bygger upp i testsituationen kan vara nästan säker på de funna kausalsambandens riktighet förutsatt att man bortser från de socialkonstruktionistiska invändningar som behandlas nedan. I nuläget finns det fyra olika nivåer av RCTer som utförs inom det medicinska området, i litteraturen kallade ”faser”. Fas 1-RCTer utförs på friska personer, fas 2-RCTer utförs på små patientgrupper, fas 3-RCTer utförs på stora patientgrupper och fas 4-RCTer utförs på mycket omfattande patientgrupper i syfte att pröva redan etablerade läkemedels fortsatta lämplighet i relation till effektivitet, bieffekter och mortalitetsfrekvens (Sager och Bohlin, 2011, s. 72). Helgesson studerar i sitt kapitel i Sager och Bohlins antologi fas 4-RCTers trovärdighet, varför en beskrivning av dessa är i sin ordning. Fas 4-RCTer äger inom medicinen rum på såväl ett geografiskt Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 som ett organisatoriskt utspritt sätt. De involverar således såväl olika testkliniker som specialiserade kontor som arbetar med att kvantifiera inskickade resultatformulär utifrån en monitors granskningar och andra funna diskrepanser. Kontakterna mellan dessa distanser administreras i sin tur genom formella samordnings- och relationsregler som kan vara av generell eller studiespecifik art (Sager och Bohlin, 2011, s. 72f). Olika kliniker rekryterar patienter och utför testerna under ledning av en så kallad prövare, dvs en läkare som givits i uppdrag att överse administrationen av testen på plats. Denna tar i sin tur hjälp av forskningssjuksköterskor och biomedicinska analytiker för att iscensätta denna administrering. Insamlad data från testen samt enskilda patienters egenskaper och förutsättningar journalförs och registreras sedan på specialutformade blanketter, så kallade case report forms (CRF). Medan journalerna klassas som källdata och stannar på de testutfärdande klinikerna så skickas CRFerna till särskilda databehandlingskontor för kvantitativ sammanställning. Detta efter att dessa godkänts av en kontinuerligt utvärderande monitor. Monitorn i fråga är anställd av en så kallad contract research-organisation (CRO), eller det läkemedelsbolag som driver prövningen, och granskar korrelationsnivåer mellan CRFer och journaler, signaturer och att det råder korrekt strukturering i relevanta pärmar. Monitorns granskning är tänkt att simulera en eventuell myndighetsgranskning och är på så vis tänkt att säkerställa att testen håller för en eventuell sådan prövning. Monitorn har dock inte befogenhet att själv rätta till felaktigheter utan arbetar istället med att notera dessa, ställa frågor och uppmana till korrigeringar. Ett arbete som syftar till att underlätta databehandlingskontorets sammanställningsarbete (Sager och Bohlin, 2011, s. 79f). Den ovan nämnda blindningsprincipen får inte brytas förrän ”clean file” utropats. Principen kan dock också brytas i nödfall, vid vilka det finns konkreta procedurer som måste genomföras för själva brytandet. Clean file är en benämning på när forskningsresultat anses rena från oklarheter och diskrepanser och således kan låsas, d.v.s. anses vara färdigbearbetade. Bearbetningsprocessen är i sig föremål för en kontinuerlig avcheckning av korrelationerna och diskrepanserna mellan CRFer och journaler på de olika nivåerna, något som Helgesson kallar datatvätt. Databehandlingskontoret kan i detta söka klargöranden, bl. a. av oklara beskrivningar, bekräftelse på att uppgifter utanför de normala gränsvärderna stämmer samt göra utredningar i sammanhang där uppgifter inte korrelerar mellan journaler och CRFer (Sager och Bohlin, 2011, s. 80f). 7.1.3 Från klinisk epidemiologi till metaanalyser och systematiska översikter Uppkomsten av metaanalyser och systematiska översikter kan i sin tur ses som ett svar på problemen med så kallad klinisk epidemiologi, ett professionellt förhållningssätt som utgår från critical appraisal. Idén om klinisk epidemiologi aktualiserades på 80-talet av John paul, ordförande för American Society for Clinical Investigation, vid en medicinsk fakultet vid McMasteruniversitetet i Toronto (Nilsen, 2014, s. 27f). På lärosätet innebar detta att den traditionella läkarutbildningen där läkarens förtrogenhet med eminensbaserad laboratoriekunskap tidigare ansetts legitimera dennes professionella bedömningar, byttes ut mot en utbildning där kompetens att inhämta och kritiskt granska aktuell forskning om specifika kliniska problem sågs som primärt mål. För att utveckla denna förmåga hos de blivande läkarna, kom utbildningarna att grundas i problembaserat lärande och grupparbeten. Praktiken tänktes utifrån detta bedrivas i enlighet med stegen i modellen för Critical appraisal (Bohlin, 2014, s. 28). Critical appraisal är en typ av professionellt utvecklingsarbete i enlighet med en femstegsmodell för professionell praktik, där praktikern i en given verksamhet kombinerar beaktande av evidens, kontextuell professionell bedömning och brukarens önskemål och förutsättningar i syfte att intervenera i brukarens situation på ett för denne optimalt gynnsamt sätt. Modellen ses som grundläggande för det paradigmskifte i början på 90-talet som kom att kallas EBM (Levinsson, 2013, s. 24 samt Nilsen, 2014, s. 45). David Sackett, en av de mer framstående arkitekterna bakom McMaster-gruppen delger i ett känt citat sin idealbild av hur praktikern i en sådan uppstrukturerad verksamhet skulle vara en person som sysslade med: Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 ”En noggrann, öppet redovisad och omdömesgill användning av den för tillfället bästa evidensen för beslutsfattande om åtgärder (insatser, metoder) till enskilda personer, kompletterad med professionell expertis och den berörda personens situation och önskemål” (Nilsen, 2014, s. 44). Metodens fem ursprungliga steg är; formulerande av informationsbehov till frågor som kan besvaras, uppletande av bästa tillgängliga kunskap utifrån behov och frågor, värderande av funnen befintlig kunskap utifrån vetenskaplighet och praktisk användbarhet, integration av utvärderingen med professionell bedömning och brukarens önskemål och förutsättningar, utvärdering av den resulterande åtgärden samt effektiviteten i stegen ovan och strävanden efter förbättring utifrån detta (Nilsen, 2014, s 45). Förtroendet för critical appraisal har kommit att avta hos delar av evidensrörelsen i ljuset av insikter om implementeringsproblemet med att lämna en sådan bedömningsprocess åt professionella utövare inom varierande komplexa verksamhetsområden (Levinsson, 2013, s. 24). Implementeringsforskning har pekat på att denna typ av förfarande är mycket svårt att implementera i praktiken då komplexiteten i i synnerhet steg 2 och 3 tenderar att styra in den professionelle på ett okritiskt evidenskonsumerande arbetssätt snarare än att uppmuntra denne till självständig evidensbaserad praktik. Steg 4 anses också i och med sin vaghet kunna ta sig många olika former hos olika praktiska utförare. En central variabel är den praktiska utförarens brist på tid och kompetens att använda modellen (Nilsen, 2014, s. 45, 55f). Denna kritik kan i sig anses vara gällande också för de tre förslag på modifikationer av critical appraisal som föreslagits då två utav dem ställer krav på utförande av steg 2 medan alla tre kräver utförande av steg 4 (Nilsen, 2014, s. 46). I detta uppstod i USA som en följd av behov av pålitligare ackumulation av information under kalla kriget, således två ersättande, eller beroende på synsätt kompletterande, funktioner; Metaanalys och systematiska översikter, som tillsammans med RCTer i nuläget anses vara evidensens tre grundpelare inom EBM (Nilsen, 2014, s. 34, Sager och Bohlin, 2011, s. 14 samt Levinsson, 2013, s. 15f och 29). Metaanalyser är statistiska sammanställningar av långa serier av studier, i Cochrane-formatets fall sammanställningar av ett stort antal randomiserade kliniska prövningar av likartade variabler (Levinsson, 2013, s. 15, Nilsen, 30fff). Metaanalysens födelse tillskrivs utbildningspsykologerna Gene Glass och Mary Smith och tillkom som en metod för att kunna omvandla kvantitativa forskningsresultat med spridda resultat till tydliga statistiska effektstorlekar. Glass och Smith omvandlade på detta vis 400 studier om psykoterapi, respektive 80 studier om korrelationer mellan klasstorlekar och elevprestationer, till metaanalyser (Nilsen, 2014, s. 30f samt Levinsson, 2013, s. 29). Metanalysers styrka anses ligga i att de utöver att synliggöra effekter, också möjliggör jämförelser mellan olika studiers utfall och därmed också statistiska sammanvägningar av uppmätt effekt (Levinsson, 2013, s. 29). Den kritik som följde var trots detta i form av invändningar mot att metaanalyser inte i tillräcklig utsträckning beaktar skillnader i variabelstruktur och kvalité mellan studier, den så kallade ”äpplen och päron”-invändningen. ”Äpplen och päron”-invändningen besvarades med argument om att allmänna kriterier bör gälla om att de studier som syntetiseras ska uppbära tillräcklig likhet med varandra. En av forskarna i den så kallade Oxfordgruppen menade att studier med fördel kan inkluderas i metaanalyser om de har en gemensam grund i att vara RCTer, något som också kommit att bli norm för de studier som inkluderas i metaanalyser. Thomas Chalmers med kollegor inom Oxfordgruppen, skapade sedermera vetenskapliga kriterier för skapandet av metaanalyser för att säkerställa att dessa, liksom RCTer, kunde anses ha god trovärdighet och metodologisk stringens (Nilsen, 2014, s. 31f). Studier som delar relevans men som inte kan syntetiseras i metaanalyser, kunde i sin tur bli föremål för systematiska översikter efter att tekniken för detta utvecklats på 90-talet. I systematiska Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 översikter används likartade kriterier som för metaanalyser i syfte att göra relevanta urval av separata studier, kritiskt granska dessa samt analysera deras sammanvägda innebörd. Systematiska översikter har kommit att bli en överordnad kategori där både metaanalyser och andra sammanställningar förekommer (Levinsson, 2013, s. 15, 29 samt Nilsen, 2014, s. 33 och 36f samt SBU, 2004). Systematiska översikter produceras inom utbildningsområdet i nuläget främst av olika former av mäklarorganisationer som kan vara statliga eller intressedrivna (Levinsson, 2013, s. 16 samt 34). Proceduren för utarbetandet av systematiska översikter kan sägas utgöra en mer formaliserad form av critical appraisal. Arbetet börjar med att forskningsfrågan formuleras utifrån fastställda principer. Forskningsfrågan kan då exempelvis bli något i stil med; ”Vad är effekten av intervention A på variabel 1 respektive variabel 2 inom populationen i kontext Z”. Forskaren utför efter frågeformuleringen en omfattande sökning efter forskningsdata utifrån den teoretiska/konceptuella utgångspunkt som föreligger som analytiskt och syntetiserande ramverk för den specifika systematiska översiktens tillämpningsområde. Insamlad data granskas kritiskt utifrån frågornas fokus och utifrån teoretisk/konceptuell utgångspunkt, och syntetiseras sedermera i för ramverket rimligt format. De systematiska översikterna redovisas i såväl vetenskapligt som verksamhetsunderlättande form genom två separata resultatredovisningar; en metod och teknikrapport och en tillämpningshandledning, där det tydligt ska framgå hur litteratursökning och kritisk granskning har gått till. Arbetet med framställning av systematiska översikter monitoreras sedermera med hjälp av granskningsprotokoll där tydliga riktlinjer utifrån principiellt ramverk kan leda arbetet i rätt riktning (Levinsson, 2013, s. 33f) 7.2 Cochrane-formatets ändamålsenlighet, implementerbarhet och trovärdighet i relation till utbildningsområdet utifrån svenska forskningsperspektiv Nedan undersöks den svenska litteraturens syn på Cochraneformatets ändamålsenlighet, implementerbarhet och trovärdighet i relation till utbildningsområdet. Med ändamålsenlighet avses formatets förmåga att hantera bredden av mål och uppdrag som skolan har. Med implementerbarhet avses formatets kapacitet att effektivt översättas till skolverksamhetens praktiska sammanhang. Med trovärdighet avses formatets förmåga att ge säkra vetenskapliga indikationer på problemlösning inom skolan. 7.2.1 Cochrane-formatets ändamålsenlighet för utbildningsområdet Magnus Levinsson menar i sin avhandling att frågan om evidensbaserad praktik inom utbildningsområdet behöver diskuteras och problematiseras utförligare (Levinsson, 2013, s. 110f). Detta inte minst då det, som ovan nämnts innehåller spår av den tidigare effektivitetsforskningen som antyder att dess nuvarande form kan vara trendartad (Levinsson, 2013, s. 19). Levinsson menar att det finns en poäng med den kritik som inom aktionsforskningen lyfts om att idéerna om evidensbaserad praktik riskerar att förvärra det distanserande från skolans verksamhet och den marginalisering av lärarkårens betydelse och behov som präglat den pedagogiska forskningen under 80- och 90-talen. Påföljande återuppväckta konflikter mellan förespråkare för kvantitativ och kvalitativ forskningsmetod, så som omnämnts ovan, menar Levinsson har ökat på denna marginalisering och lämnat lärarna i en kluven position mellan professionalitet och tjänstemannaskap (Levinsson, 2013, s. 17f samt 107). Cochrane-formatet utgår vidare ifrån empirismen, d.v.s. att verkligheten definieras genom stringens mellan upprepade sinnesobservationer. Här förväntas alltså verkligheten tala för sig själv och det mänskliga subjektet hålla sig borta från att ge tolkningar utöver det som direkt observerats med sinnesorganen. Per Nilsen tar i sin antologi upp att det i debatten kring den önskvärda relationen mellan rationalism och empirism inom evidensbaserad praktik har påtalats att renodlad empirism i Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 form av RCTer som golden standard, kan förvanska laboratoriefynd och beprövad erfarenhet som trots att de inte verifierats genom RCTer sammanställda i metaanalyser, ändå utifrån rationalistisk synvinkel uppbär trovärdig ontologisk status (Nilsen, 2014, s. 49f). I detta ingår rimligen kunskap om den kontextuella variation som är omöjlig att täcka upp i RCTer och som är vanligt förekommande i skolmiljö. Levinsson konstaterar vidare att en praktisk utförare kan befinna sig i en kontext där en metaanalytiskt verifierad och ordinerad åtgärd inte är ändamålsenlig och till och med kan vara direkt skadlig för den aktuelle klient som åtgärden rent empiriskt anses kunna gagna (Levinsson, 2013, s. 101). Här menar den i debatten frekvent förekommande utbildningsforskaren Martyn Hammersley enligt Levinsson att ändamålsenlig kvalitativ forskning riskerar att uteslutas ur evidensdefinitionen som en följd av evidensrörelsens rigorösa krav på empirisk stringens (Levinsson, 2013, s. 60). Martyn Hammersley menar vidare enligt Levinsson att evidensrörelsen genomsyras av ett positivistiskt ideal som driver detta uteslutande av kvalitativ forskning (Levinsson, 2013, s. 60). Nilsen tar i sin antologi i relation till detta upp att kritiska forskare ifrågasatt huruvida RCTer alls är kapabla att ge relevanta svar på problem inom vissa verksamhetsområden. Detta i och med att RCTer utgår ifrån en positivistisk naturvetenskaplig syn på forskning där subjekt kan reduceras till objekt i kontrollerade miljöer (Nilsen, 2014, s. 51). Nilsen och Levinsson tar vidare upp att flera kritiker menar att denna typ av reduktionism specifikt gör det svårt att besvara frågan om vad det är som fungerar i och med att den praktiska kontextens variabler är svåra att kontrollera experimentellt. Med detta avses den kvantitativa forskningens intresse för kausalsamband på bekostnad av förståelse för orsakerna till kausalsamband, samt på bekostnad av kvalitativa variabler som är minst lika viktiga att beakta. RCTer har utifrån detta resonemang för låg extern validitet för att dess resultat ska kunna generaliseras på ett sätt som besvarar den för utbildningsområdet centrala frågan om vad som fungerar för vem och i vilken kontext, eller för den delen den centrala frågan om om, och i så fall vilken, funktion RCTer fyller i relation till påverkan. Nilsen och Levinsson menar att skolan dels har många mål som är kopplade till egenskaper och förmågor som inte kan mätas experimentellt såväl inom ämnen som inom värdegrundsarbetet. Utöver detta kan alternativ forskning, exempelvis kvalitiativ sådan ses spela en stor roll för förmågan att identifiera problem och att i olika situationer nyttja perspektivbyten (Nilsen, 2014, s. 51 samt Levinsson, 2013, s. 61f). Frågan om RCTers ändamålsenlighet för psykosociala verksamhetsområden, exempelvis utbildningsområdet, problematiseras vidare av Nilsen med hänvisning till en serie variabler som RCTer är inkapabla att hantera. Här ingår utförareffekter, representativ urvalskvantitet och etiska låsningar. Med utförareffekter avses de subjektiva påverkansvariabler som informellt har en del i den vetenskapliga processen eller sker i samband med denna, något som behandlas mer utförligt i relation Claes-Fredrik Helgessons, Bruno Latour och Steven Wollgars studier nedan. Med representativ urvalskvantitet avser Nilsen det faktum att det inom psykosociala verksamheter, där många variabler och stora variationer mellan individer, klasser och grupper förekommer, behövs ett mycket stor urval ur populationen för att detta ska vara representativt för mångfalden av kontexter och därmed generaliserbart på hela populationen. Han tar här också upp att ändamålsenliga RCTer måste utföras i en realistisk experimentmiljö som beaktar den specifika kontextens förutsättningar i form av resurser, organisering och kompetenser. RCT-miljöer är istället ofta idealiserade, dvs det existerar inga störande externa faktorer i dem. Testsubjekten är dessutom ofta homogena och selektivt utvalda för att optimera tydligheten i utfallen. RCTer av denna typ förutsätter att en implementeringsarena finns där högmotiverade,kompetenta aktörer sjösätter interventionen i en miljö av optimerad organisation och tillräckliga resurser (Nilsen, 2014, s. 51f). Nilsen tar i relation till detta upp att det enligt kritiker föreligger ett så kallat ”ekologiskt felslut” i att låta aggregerade studier av kontrollerad experimentell art vara generellt gällande trots att den praktiska verkligheten präglas av individuella klienter med individuella behov (Nilsen, 2014, s. 54). RCT-förespråkares antaganden om att en idealiserad implementeringsarena finns inom psykosociala Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 verksamhetsområden, och att det inte är nödvändigt att uppmärksamma diskrepansen mellan generaliseringar och kontextuella variationer, bör ses som problematisk också i ljuset av Bergmark och Lundströms resonemang kring klienternas motivation nedan. Den etiska låsningen som Nilsen slutligen tar upp syftar på att det finns etiska problem med att i verksamheter som kräver longituditionella studier för att kunna uppmäta effekt, förneka etablerade kontrollgrupper de gynnsamma effekter som teoretiskt kommer utav de korrekta interventionerna i experimentgruppen (Nilsen, 2014, s. 51f). Något som kanske i synnerhet är relevant i skolans fall där experiment skulle kunna ha en direkt skadlig inverkan på slumpmässigt utvalda elevgrupper i en eventuell kontrollgrupp. Att som forskare i skolan medvetet hindra lärare och elever från att uppnå de mål som skolans verksamhet syftar till har i sig rimligen än mer tvivelaktiga etiska följder. Inte minst då Skollagen klargör att yrkesverksamma i skolan utöver måluppfyllnad också förväntas följa etiska riktlinjer kring elevernas måluppfyllnad (Skollagen, 2010, kap 3, §3). Bergmark och Lundström driver i sitt kapitel i Sager och Bohlins antologi en kritisk tes i relation till RCTers ändamålsenlighet för missbruksvård som uppbär relevans för dess applicering på psykosociala verksamhetsområden i allmänhet. De menar att en betydande mängd studier visat att RCTer av psykosociala och psykoterapeutiska interventioner i relation till missbruksbehandling, systematiskt tenderar att drabbas av vad de kallar för ”drontens domslut”, efter en passage i Alice i underlandet där dronten i egenskap av tävlingsdomare proklamerar att alla deltagare har vunnit tävlingen. Med detta avses svårigheten att identifiera skillnader i effekt mellan olika behandlingsinterventioner genom bruket av så kallade relativa RCTer, där effekterna av olika behandlingar och variabler har undersökts (Sager och Bohlin, 2011, s. 177f). Drontens domslut är en titulering som Bergmark och Lundström använder för att beskriva såväl situationen inom forskningen kring missbruksbehandling i allmänhet liksom utfallet av ett mycket omfattande kliniskt forskningsprojekt inom psykologisk missbruksvård; MATCH. Ambitionen med MATCH var enligt Bergmark och Lundström att identifiera vilka klientegenskaper och terapeutiska behandlingsmetoder som var mest gynnsamma att matcha. Detta strävade man efter att åstadkomma genom användandet av just de relativa RCTer som omnämnts ovan, där effekterna av olika matchningar skulle undersökas. Resultatet av projektet blev dock enligt Bergmark och Lundström en besvikelse. Varken pålitliga matchningseffekter eller specifika mekanismer identifierades av RCTerna, något som tillsammans med drontens domslut enligt Bergmark och Lundström gör idén om upprättandet av riktlinjer i enlighet med så kallad best practice, där störst effekt medför användande, irrationell (Sager och Bohlin, 2011, s. 178f). Bergmark och Lundström menar att drontens domslut och utfallet av MATCH hänger samman med RCTers låga externa validitet som omnämnts ovan. Medan det i testsituationen naturligt föreligger testsubjekt som frivilligt deltar i behandlingen så menar de att missbruksvården istället ofta är inriktad mot omotiverade och ibland också tvångsbehandlade klienter. Att istället bedriva RCTer på dessa grupper menar Bergmark och Lundström är orimligt i och med att dessa då skulle behöva slumpmässigt fördelas på exempelvis vårdinrättningar trots att ett sådant fördelande inte är hållbart ur etisk synpunkt (Sager och Bohlin, 2011, s. 179f). De menar att situationen med att få RCTer finns bedrivna på omotiverade klienter, att svårigheter finns med att uppnå dessa samt att en omfattande förekomst av drontens domslut identifierats, gör det orimligt att anamma snäva evidenshierarkier så som Cochrane-formatet inom psykosocial missbruksbehandling (Sager och Bohlin, 2011, s. 180). Resonemanget är relaterbart till två av de aspekter av RCTers ändamålsenlighet för utbildningsområdet som Nilsen och Levinsson omnämnt ovan. Dels genom det etiska problemet med att experimentera med nya metoder på elever som har rätt till en likvärdig utbildning. Såväl missbrukare som elever har rimligen rätt till en etiskt hållbar behandling. Dels genom orimligheten i att applicera resultat från idealiserade frivilliga RCTer på ofrivilliga testsubjekt. Såväl Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 tvångsbehandlade missbrukare som skolpliktiga elever kan anses särskilja sig markant från de frivilliga och motiverade testsubjekt som deltar i RCTer. Argumenten för Cochrane-formatet utgår ifrån uppfattningen att det kvalitetssäkrande och den utveckling av såväl metod som professionell förmåga som följer utav att arbeta utifrån systematiska översikter av RCTer, bidrar till att legitimera professionen på ett sätt som gynnar dess utövare. Motståndarna menar istället att denna typ av standardisering av den professionella praktiken leder till detaljstyrning av den professionelles agerande som innebär en skadlig inskränkning i den professionelles självständighet. Denna inskränkning ska enligt dessa innebära en reducering av den professionelles förmåga till innovativt tänkande och kontextbundna bedömningar, och leder i förlängningen till en form av forskningsanvändning som inte är gynnsam inom psykosociala verksamhetsområden så som utbildningsområdet (Nilsen, 2014, s. 52f samt Levinsson, 2013, s. 60ff). Nilsen påvisar vidare att en diskussion förts kring huruvida Cochrane-formatet och andra former av kvantitativ evidens demokratiserar eller avdemokratiserar verksamheter. Evidensförespråkare menar enligt Nilsen att bruket av korrekt utformade systematiska översikter stödjer professionella och brukares integritet då auktoritets- och eminensstyrd praktik bannlyses. När så sker befrias dessa från ovetenskapliga och verksamhetshämmande direktiv som hindrar professionen från legitimitet och brukarna från en trygg och säker praktik (Nilsen, 2014 s. 53f). Kritiken mot denna argumentation vänder enligt Nilsen på perspektiven och menar på att auktoritets- och eminensstyrd praktik i själva verket främjas av bruket av kvantitativ evidens som dominerande kunskapskälla. Detta menar man sker genom att den makt som professionella och brukare ändå haft att förhandla om kunskapsanspråken utifrån det kontextuella sammanhanget, går förlorad när makt förskjuts till beslutsfattare och myndigheter som anser det kontextuella sammanhanget vara sekundärt till generella paketlösningar så som systematiska översikter (Nilsen, 2014, s. 54). Gert Biesta, en annan framträdande utbildningsforskare, framhåller i enlighet med detta enligt Levinsson att kvantitativ evidens är såväl odemokratisk som avprofessionaliserande (Levinsson, 2013, s. 62). Det tas också upp här att de många sociala verksamhetsområden där brukarens önskemål anses viktiga, tappar förmågan att tillfredsställa dessa önskemål om de också ska beakta kriterierna för evidensbaserad praktik (Nilsen, 2014, s. 55). Med alltför stort resultatfokus riskeras det att kvalitativa värden som går bortom vetenskapligt fokus på resultat går förlorade. På motsvarande sätt riskerar ett sådant fokus att bortse från kvalitativa variabler som måste beaktas för att forskningen ska kunna anses praktiskt relevant. I och med att utbildningsområdet genomsyras av sådana värden och variabler kan Cochrane-formatet utifrån resonemangen ovan, ses som icke ändamålsenligt för detta. 7.2.2 Cochrane-formatets implementerbarhet inom utbildningsområdet Nilsen påpekar i enlighet med de resonemang som delges ovan, att det finns betydande svårigheter med att överföra idealiserade RCTer till utbildningsområdet på pålitliga sätt (Nilsen, 2014, s. 50f). Levinsson menar också att många kritiker har lyft fram att det finns svaga belägg för att Cochranemodellen gett önskvärd effekt inom utbildningsområdet, men ändå uppvisar desto starkare likgiltighet inför de implementeringsproblem som uppstått i relation till detta (Levinsson, 2013, s. 63). Bl. a. utbildningsforskaren Lejf Moos har enligt Levinsson menat att detta bottnar i den alltför instrumentella syn på exempelvis klassrumspraktik så som beskrivits ovan (Levinsson, 2013, s. 61). Ingemar Bohlin nämner också att liknande kritik mot Cochrane-formatet som Nilsen och Levinsson tar upp, också lyfts inom läkarprofessionen; att det vetenskapsideal Cochrane-formatet framhäver övervärderar RCTers interna validitet samtidigt som det underskattar värdet av den professionella kompetens som krävs för att implementera vetenskapliga fynd på effektiva sätt i praktiken (Nilsen, 2014, s. 38). Detta har i sig en effekt på den mänskliga faktorn, något som i synnerhet Levinsson fokuserat på i sin Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 avhandling. Här beaktas hur yrkesverksamma lärare känslomässigt reagerar på att få i uppdrag att implementera forskning utifrån systematiska översikter i den praktiska verkligheten när den externa validiteten i dessa visat sig bristfälliga (Levinsson, 2013, studie 1 o 3). Levinsson pekar i sin avhandling på att så kallad research utilization-forskning, eller implementeringsforskning på svenska, har upptäckt att ett antal mänskliga faktorer tenderar att i allmänhet försvåra implementering av forskning inom utbildningsområdet. För det första har det faktum att forskningsresultat tenderar att presenteras med ett abstrakt och teoretiskt språk, visat sig försvåra smidig forskningsläsning. För det andra har lärare i sin utbildning fått för lite utbildning i hur forskningsläsning ska gå till. Till det tillkommer mänskliga faktorer kopplade till hur skolan och lärare successivt har nedprioriterats av samhället. Resursbrist i relation till möjligheter till forskningsläsning, känsla av förfrämligande inför forskningsläsning samt ovilja att bryta rutiner kan här knytas samman med sådana faktorer (Levinsson, 2013, s. 46). Andra exempel som implementeringsforskningen enligt Levinsson har upptäckt på att sådana oprofessionella förhållningssätt har vuxit fram, är att forskning ofta används av lärare i syfte att bekräfta den egna metodens lämplighet oavsett om detta är legitimt att göra. En annan funktion forskningen kommit att få är som ett verktyg som lärare använder för att upprätta distans till kollegor genom akademiskt språkbruk (Levinsson, 2013, s. 48) Sammantaget konstaterar den av Levinsson nämnda implementeringsforskningen att forskningsimplementering inom utbildningsområdet i allmänhet är svårkontrollerad, oförutsägbar och svår att understödja (Levinsson, 2013, s. 49). Formativ bedömning är en metod som OECD enligt Levinsson anser är såväl relevant som direkt överförbar till skolkontexten. Detta som en följd av dess stora effektstorlekar i systematiska översikter (Levinsson, 2013, s. 35, 199f, 202). I relation till specifikt formativ bedömning pekar Levinsson på att en rad implementeringsproblem observerats. Formativ bedömning ses ofta av lärare som en smärtsam extra börda. Formativ bedömning utifrån kriterieuppfyllnad ses vidare som en form av externt pålagd kontroll (Levinsson, 2013, studie 3, s. 4ff). Lärare har enligt Levinsson också tenderat att anamma en snäv definition av formativ bedömning vilken föranlett bedömning av lärande snarare än den bedömning för lärande som är avsikten med formativ bedömning. Lärares känslor av förvirring kring implementeringens innehåll och brist på kontroll över dess process liksom elevers tendens att motverka implementeringen av formativ bedömning är också fenomen som enligt Levinsson identifierats i mer forskning än dennes egna (Levinsson, 2013, studie 3, s. 6-9). I sina egna studier, så som dessa sammanställts i dennes doktorsavhandling, tar Levinsson avstamp i en uppfattning om värdet i att utforska levd erfarenhet inom ramen för vad man inom fenomenologin kallar livsvärldar. Han utgår således från en fenomenologisk ansats som fokuserar på samverkan mellan forskare och deltagare. I detta har han arbetat med deltagande observation, intervjuer, fältanteckningar, reflektionsdagböcker och ljudupptagningar. Fenomenologen Van Manens recept för konstruktivt bruk av ofrånkomlig och livsvärldsbunden subjektivitet anges vidare som normerande för arbetet (Levinsson, 2013, s. 78fff). Detta recept föreskriver att egna och andras upplevelser ska beskrivas bokstavligt utifrån sinnesupplevelser liksom utifrån känslor och stämning och således inte överdrivas genom exempelvis målande språkbruk (Levinsson, 2013, s. 81). Praktiskt har arbetet gått ut på initierande av och deltagande i en projektgrupp med lärare vilka arbetat med att pröva implementering av formativ bedömning. Levinsson applicerar därmed ingen förklarande teori på situationerna han studerar utan försöker istället fånga hur de studerade lärarna själva upplever de fenomen som uppstår när kvantitativ evidens ska omsättas i praktiken. I sin första studie finner Levinsson utifrån denna teoretiska grund att den lärare han studerat, Anders, befinner sig i en livsvärld som är omöjlig att träda ur vid implementerandet av formativ utvärdering. Detta medför att implementeringsprocessen måste åtföljas av ett vidgande av Anders livsvärld som naturligt blir kantat av såväl besvikelser som upplevelser av nya möjligheter (Levinsson, Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 2013, s. 205f, 226). En stor del av problemen som Anders upplever vid implementeringen berör kommunikationen med eleverna och det faktum att han känslomässigt bryr sig om hur denna kommunikation fungerar. Anders upplever att eleverna har olika svårt att uttrycka sig om sina ämneskunskaper när frågor om dessa ställs, varför det formativa samtalet i relation till såväl enskilda individer som till hela klasser blir lidande. P.g.a. begränsningar i tid och stora klasstorlekar upplever han också att det blir svårt att lägga ner mer kraft på att lösa kommunikationen. Anders upplever också att confounders föreligger. Dels i form av att elever försöker framställa sig som mer kunniga än de är under det formativa samtalet, i tron att de bedöms summativt. Dels i form av att elevernas motivationsnivåer påverkar deras kapacitet att arbeta med formativa samtal (Levinsson, 2013, s. 223ff). Levinsson menar att det som framgår av studien är att formativ bedömning inte kan implementeras mekaniskt och att det kan komma att implementeras på många olika sätt som en följd av lärares olika livsvärldar i termer av verklighetsuppfattningar och prioriteringar (Levinsson, 2013, s. 227ff). Levinssons tredje studie utvecklar dessa fynd genom att följa Henrik, en fysiklärare, och dennes arbete med att införa formativ bedömning. Denne har provat och upplevt sig misslyckas med implementering av formativ bedömning som en följd av svårigheten i att förklara innebörden och värdet i formativ bedömning för eleverna, liksom som en följd av svårigheten att genomföra den komplexa feedback som krävs. Effekten av det förra upplever Henrik blev att eleverna motsatte sig implementerandet av formativ bedömning på ett svårhanterat sätt, medan effekten av det senare upplevdes bli att Henrik började ge för eleverna tydligt meningsbefriad feedback (Levinsson, 2013, studie 3, s. 13ff). Som en följd av detta hade Henrik återgått till sin traditionella roll för att kunna förmedla faktakunskaper utifrån begränsade tidsramar som ändå enligt Henrik är svåra att bedöma formativt. Lojaliteten gentemot eleverna föranledde också en rädsla hos Henrik för att vara för otydlig genom de formativa omdömena och därmed äventyra elevernas betyg. En rädsla som också bidrog till att återgången föreföll som en säkrare lösning (Levinsson, 2013, studie 3, s. 16f, 20f). Henrik drev dock på implementeringsprocessen driven av en känsla av rädsla för att misslyckas med en formativ bedömning som han upplevde gynnar elevernas lärande mer än traditionell undervisning. Genom att en ny skolkultur också etablerats som möjliggjorde mer öppna lektioner blev effekten av detta att Henrik övergav de skriftliga stegen till förmån för ett anammande av vad han kom att kalla ett konversationsbaserat lärande. Detta lärande bestod i att Henrik ställde öppna diagnostiska frågor i klassrummet som enligt honom möjliggjorde direkt själv och kamratbedömning hos eleverna liksom feedback till läraren om elevernas ämnesförståelse (Levinsson, 2013, studie 3, s. 16ff). Vid kollegiala samtal om formativ bedömning visade det sig att Henrik i viss mån var socialt utfrusen som en följd av att andra fysiklärare tolkat formativ bedömning som lärarcentrerad, d.v.s. som en metod för utvecklande av undervisningen snarare än en undersökning av elevernas förståelse så som Henrik tolkat det. Något som orsakade tvivel hos Henrik tills denne genom samtal med Levinsson och dennes forskarkollega Silwa Claesson fick det klarlagt att den konkreta definitionen av vad som exakt utgör formativ bedömning är oklar (Levinsson, 2013, studie 3, s. 21f). Henrik erfor också att dennes involvering i implementerandet av formativ bedömning användes mot honom i löneförhandlingarna, något som rimligen ytterliggare belyser kontexters komplexitet (Levinsson, 2013, studie 3, s. 19) Slutsatserna Levinsson drar av Henriks upplevelser är att det är viktigt att i frågan om systematiska översikters implementerbarhet, beakta hur livsvärldar och psykosociala kontexter påverkar lärarens känslomässiga inställning till dess implementering. Läraren har när implementeringsarbetet ska påbörjas etablerat en livsvärld där erfarenheter och verklighetsuppfattningar avgör inställningen till implementeringen. Samtidigt kommer såväl elever, kollegor som läraren själv, ge läraren feedback som förorsakar olika nya känslors uppkomst. I Henriks fall blev implementeringsprocessen enklare först då han erhållit tillräcklig erfarenhet för att känna sig trygg i arbetssättet (Levinsson, 2013, studie 3, s. 23ff). Utifrån sina observationer kring Henriks upplevelser drar Levinsson likartade slutsatser Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 som i relation till Anders, d.v.s. att implementering av formativ bedömning i skolan inte är omöjlig men däremot allt annat än enkel och förutsägbar. Något som Levinsson menar föranleder problem i relation till att beslutsfattare på policynivå tror att systematiska översikter är enkla att implementera (Levinsson, 2013, studie 3 s. 25). Janna Skagerström tar i sitt kapitel i Nilsens antologi upp det så kallade Riskbruksprojektet som ett exempel på lyckad implementering av RCT-grundad forskning vars utfall liksom formativ bedömning till stor del grundar sig på psykosociala faktorer inom ramen för en dialog mellan brukare och klient. Hon beskriver här hur motiverande samtal (MI), en psykologisk behandlingsmetod som betraktats som högkvalitativ utifrån RCTer, implementerats effektivt inom mödrahälsovården. Syftet med projektet var att minska alkoholmissbruket hos gravida genom att förändra bemötandet av dessa inom mödrahälsovården (Nilsen, 2014, s. 219f). MI som metod har enligt Skagerström i systematiska översikter av RCTer visat sig ha en absolut effekt på alkoholmissbruk i allmänhet, och en relativ likvärdighet med andra behandlingsmetoder. I enskilda RCTer menar hon att metoden också har bedömts ha påtagliga effekter i relation till alkoholmissbruk hos specifikt gravida. MI implementerades i projektet tillsammans med en form av screeningverktyg för alkoholmissbruk, AUDIT, som visat sig effektiv utifrån kvalitativa upplevelsestudier (Nilsen, 2014, s. 223). Genom att kombinera utbildning i MI och i AUDIT med nya arbetsrutiner kring mötet med havande, implementerades det tänkta projektet mycket effektivt. Skagerström menar att detta delvis bottnar i att projektet implementerats i en organisation med en mottaglig och enhetlig organisationskultur, och delvis i projektets stora omfattning (Nilsen, 2014, s. 221f, 226f). Hon analyserar vidare orsakerna till den lyckade implementeringen genom hänvisning till Everett M. Rogers diffusionsteori där fem upplevelsefaktorer hos utförarna anses viktiga för framgångsrik implementering; Upplevelse av relativ fördel, upplevelse av kompatibilitet med praktisk arbetssituation, upplevelse av måttlig komplexitet i implementeringen, upplevelse av möjlighet att pröva implementeringens effekter samt observerbar förändring som en följd av implementeringen. Skagerström menar att i synnerhet den relativa fördelen och komplexiteten upplevts som positiva medan upplevelserna har varit blandade kring kompatibiliteten och observerbarheten i implementeringen. Prövbarheten har i sin tur varit oklar som en följd av att projektet visat sig ha haft en framgångsrik ”output” i form av att den tänkta implementeringen kommit på plats, men samtidigt en oklar ”outcome” som en följd av att inga påtagliga skillnader i nivån av alkoholmissbruk hos gravida har kunnat observeras före och efter projektets genomförande (Nilsen, 2014, s. 225f). Skagerström menar således sammantaget att projektet varit ovanligt framgångsrikt i relation till de svårigheter som brukar föreligga i relation till implementering, men att detta faller till föga för att implementeringen inte visat sig ha avsedd effekt på gravidas alkoholmissbruk (Nilsen, 2014, s. 228ff). Något som utvecklas vidare under frågan om Cochrane-formatets trovärdighet nedan. 7.2.3 Cochrane-formatets trovärdighet i relation till utbildningsområdet Skagerströms kapitel i Nilsens antologi vilket beskrivits ovan behandlar också huruvida Cochraneformatets trovärdighet kan ifrågasättas på basis av den påfunna bristen på effekt av implementeringen av MI. Som ovan beskrivits resulterade enligt Skagerström inte användandet av motiverande samtal i Riskbruksprojektet, i ett minskat missbruk hos gravida, trots att såväl enstaka RCTer som systematiska översikter av RCTer menade att så skulle vara fallet (Nilsen, 2014, s. 223, 228f). Skagerström menar dock att detta kan bottna i att andra delar av den implementerade forskningen inte befunnit sig högt upp i Cochrane-formatets evidenshierarki. De kvalitativa upplevelsestudier som legat till grund för legitimerandet av AUDIT som metod, befinner sig enligt Skagerström på nivå 4 i den evidenshierarki som presenteras ovan, och uppbär också problem som en följd av att de inte mäter själva effekterna av AUDIT på gravidas alkoholmissbruk. Introducerandet av en arbetsrutin där tidigare möten med gravida var en del, var enligt Skagerström i sin tur grundad i Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 en enstaka studie som observerat tendenser till avbrutet alkoholmissbruk som en följd av möten med mödravården, men som bedrivits utan avsikt att mäta direkta effekter av att förlägga dessa möten tidigare. Studien placerar sig enligt Skagerström som en följd av detta på nivå 6 i evidenshierarkin; respekterade auktoriteters åsikter (Nilsen, 2014, s. 229). Riktlinjerna för bruk av MI var heller inte särskilt rutiniserade enligt Skagerström (Nilsen, 2014, s. 226), något som kan ha föranlett sporadisk tillämpning. Utifrån Skagerströms slutsatser förefaller snarare förekomsten av forskning som inte värderas högt i evidenshierarkin, bristen på formalisering av MI samt avsaknaden av omfattande studier kring just outcome av MI, vara orsakerna till det bristfälliga utfallet (Nilsen, 2014, s. 226, 228f). Utifrån detta blir det relevant att studera Cochrane-formatets trovärdighet utifrån hur litteraturen beskriver dess egna premisser snarare än utifrån hur dess implementering fallit ut. Nilsen tar i sin antologi upp det smått genanta faktum att giltigheten i Cochrane-formatet, där RCTer som syntetiserats, kvantifierats och systematiserats i metaanalyser och systematiska översikter anses mest trovärdiga, inte har prövats enligt samma modell, eller likartade modeller. Istället menar kritikerna enligt Nilsen att denna modell bygger på rationalistiska slutledningar snarare än empiriska. Alltså en typ av slutledningar som ligger lågt i den ovan angivna evidenshierarkin. De menar här enligt Nilsen att de positiva resultat man funnit komma utav riktlinjer och standardiseringar utifrån evidenshierarkin, inte heller är tillräckligt omfattande för att kunna anses verifiera evidenshierarkin, varför rationalism fortfarande underbygger legitimerandet av metoderna (Nilsen, 2014, s. 55). Här synliggörs värdet av de vetenskapssociologiska perspektiv som Latour och Wollgar och Helgesson utgår ifrån nedan. Detta då det är uppenbart att det föreligger betydande risker med att se på metoder och resultat som helt befriade från mänsklig subjektiv påverkan också i sammanhang där mycket rationalistisk tankekraft lagts ner på att frammana pålitliga empiriska mätinstrument. Helgesson beskriver i sitt kapitel i Sager och Bohlins antologi hur flertalet vanliga argument mot fas 4RCTers objektivitet som brukar föras i enlighet med den så kallade ”misstagens sociologi”, präglat tidigare forskning (Sager och Bohlin, 2011, s. 90). Misstagens sociologi har enligt Helgesson påpekat att det hänt att RCTer har varit riggade, d.v.s. har varit medvetet utformade för att ge systematiskt snedvridna resultat. Detta har bl.a. skett genom selektiva doseringar i syfte att få ett specifikt läkemedel att gå vinnande ur en komparativ studie. Vidare menar han att misstagens sociologi upptäckt att det ibland förekommer publiceringsbias, där avvikande RCT-fynd uteslutits ur publikationerna för att ge överdriven effektindikation, samt att situationer uppkommit där ansedda experter inom olika fält lånat sina namn åt texter som författats av läkemedelsbolag, på ett sätt som gör det oklart huruvida de namnutlånande experterna alls har tagit del av de primärstudier som texterna bygger på. Helgesson poängterar att denna kritik emellertid enkelt kan avfärdas genom referens till att de angivna problemen är resultat av för svag formalisering (Sager och Bohlin, 2011, s. 74f). På så vis har denna typ av kritik små implikationer för RCTers evidensstyrka. Som en följd av detta har Helgesson gjort en vetenskapssociologisk studie i syfte att studera huruvida RCTer i sin korrekt utförda form, d.v.s. i enlighet med dess formalisering, innehåller implikationer för objektiviteten. I syfte att utforska detta har han valt att undersöka utförandet av en fas 4-RCT, vilkens särart beskrivits ovan. Helgesson har ingen uttalad socialkonstruktionistisk ansats men har liksom Latour och Wollgar utgått ifrån en tes om att vetenskaplig data också i formaliserad form konstrueras socialt och, som ovan nämnts, att kritikers fokusering på misstagens sociologi föranlett en möjlighet för evidensrörelsen att bortförklara trovärdighetsbrister med att för låga nivåer av formalisering varit föreliggande (Sager och Bohlin, 2011, s. 90). Liksom Levinsson, Latour och Wollgar har Helgesson också arbetat med deltagande observation för att därmed producera kvalitativ empiri (Sager och Bohlin, 2011, s. 70). Det empiriska underlaget har sedermera utgjorts av sextio observationer på olika geografiskt och funktionsmässigt åtskiljda delar av en genomförd fas 4-RCT. Dessa observationer har Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 av Helgesson nedtecknats på anteckningsblock för att sedan föras in i indexerande datasystem (Sager och Bohlin, 2011, s. 78). De utföranden Helgesson bevittnade hade en formaliserad procedur som sammanföll väl med den beskrivning av fas 4 –RCTer som delgetts ovan. Under studiens gång bevittnade Helgesson tre fenomen som han menar tillsammans med den geografiska spridningen uppbär implikationer för objektiviteten i den studerade fas 4-RCTn. Detta trots att de enligt honom utgjorde centrala delar av den formaliserade processen. Dessa tre fenomen var; datatvättning, subjektiva rättanden och idéer om anomalier som tecken på korrekt utfört arbete. Datatvättning är enligt Helgesson en procedur där såväl forskningssköterskor som monitor kontinuerligt städar undan avvikelser i formaliseringen så som uteblivna signaturer eller beskrivningar av åtgärdade problem. Detta på ett sätt som ”rengör” den data som sedermera skickas vidare till databehandlingskontoret. En forskningssköterska beskrev enligt Helgesson att då det hände att denna städning uteblev i syfte att tvinga den ansvarige prövaren att ta större ansvar för proceduren, så kunde stora mängder anmärkningar uppstå vid monitorns besök som annars hade försvunnit (Sager och Bohlin, 2011, s. 81f). Datatvätt kan enligt Helgesson vara en följd av att konflikter mellan generella och studiespecifika regler driver forskningssköterskor att ljuga för monitorn om var journalanteckningar i första hand antecknats. Det exempel som för Helgesson uppenbaras är att så kan ske på gula postit-lappar snarare än i föreskrivna formulär. Han menar vidare att det också kan handla om att monitor upprättar granskningssystem i pärmarna med just gula postit-lappar som forskningssköterskorna sedermera reflexmässigt städar bort på grund av dålig kommunikation med monitor eller som en del i städningsprocessen (Sager och Bohlin, 2011, s. 82f). Samma lappar kan alltså enligt Helgesson upplevas som hjälpmedel för, och motmedel mot, monitorn. Avvikelser avfärdas också ofta enligt Helgesson genom spekulativa samtal mellan forskningssköterskor och monitorer. Som exempel tar han upp att en gul postit-lapp som beskriver hur en patient fått medicin som inte ska tas på morgonen avfärdades som felaktig på basis av att etablerade rekommendationer anger att så inte ska ske. Lappen i fråga ersattes således enligt Helgesson med en ny gul lapp som angav avvikelsen vara själva påståendet att så skett snarare än att så har skett. Denna nya gula lapp städades sedermera bort av monitorn och ersattes av en notis om ändring samt en signatur. Inga av dessa lappar var således källor som följde med i dokumentationen (Sager och Bohlin, 2011, s. 84). Utöver datatvättens osynliggörande av uppkomna avvikelser och procedurer för dess avfärdande, så menar Helgesson att det också skedde rättningar av avvikelser utifrån subjektiva trolighetsavvägningar när uppgifter i journaler och CRFer skilde sig från varandra. Forskningssköterskor och monitorer kunde enligt Helgesson komma att besluta om vilken av källorna som var felaktig och utifrån det korrigera den ena källan i enlighet med den andra källan. På databehandlingskontoret kunde denna form av bedömning enligt Helgesson ske utifrån upplevd eminens. Som exempel tar Helgesson upp att en upplevd diskrepans mellan två EKGn föranledde databehandlingskontoret att enigt tolka dessa som tagna på två olika patienter. Enigheten föranledde i sin tur att den ansvarige prövarens insisterande på att dessa tagits på samma patient avfärdades liksom båda EKG-mätningarna. Helgesson menar vidare att tolkning och successiv normering av innehållet i öppna svarsfält på CRFer är ett annat tillfälle där databehandlingskontoret rättar till avvikelser på ett subjektivt sätt (Sager och Bohlin, 2011, s. 85f). Slutligen observerade Helgesson att idéer hos monitorer om att avvikelserna bekräftade testsituationens autenticitet fungerade som ett sätt att normalisera datatvätt och andra former av rättningar. Testsituationer utan avvikelser ansågs därmed troligen vara fabricerade medan den typ av felaktigheter i beskrivning i och mellan journaler och CRFer, uteblivna signaturer, abnormala Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 gränsvärden o.s.v. som bearbetades medelst subjektiva bedömningar ansågs bekräfta studiens förmåga att resultera i en objektiv slutprodukt (Sager och Bohlin, 2011, s.86f). Helgessons slutsats i detta är att fas 4-RCTer i första hand är formaliserade i syfte ge maximal precision och verifierbarhet samt att skapa en upplevelse av autenticitet, inte att skapa exakthet i resultaten. Han illustrerar det hela genom en liknelse med en regnvattenmätare. Så som fas 4-RCTer är utformade så säkerställer de enligt Helgesson att de vet att de mäter regnvatten, mäter exakt hur mycket av detta som befinner sig i regnmätaren och gör också så på korrekt sätt. Problemet menar han är att regnvattenmätaren läcker och att resultaten således inte representerar hur mycket regn som faktiskt har fallit. Så som fas 4-RCTer är utformade så kan de alltså enligt Helgesson inte sägas vara objektiva utan snarare formellt och informellt ordnade på ett sätt som skapar upplevelser av objektivitet (Sager och Bohlin, 2011, s. 88f). En process som han menar förenklas av den stora geografiska spridningen där avvikelser går från att för monitorer vara bevis för autenticitet, till att osynliggöras på resan till databehandingskontoret där i sig ytterliggare subjektiv datatvätt äger rum. Den verifieringsvänliga och precisionsskapande datatvätten i kombination med avståndens osynliggörande av denna datatvätt skapar därmed en illusion om att formaliseringen är likställd objektiviteten. Således framstår studier som präglats av avvikelser och osynliggöranden av dessa avvikelser som tydliga bevis för resultatens sanningsenlighet (Sager och Bohlin, 2011, s. 91f). Helgesson menar att dessa fynd gör gällande att bilden av fas 4 RCTer, och i förlängningen RCTer i allmänhet, behöver nyanseras i syfte att värna om såväl vetenskaplig kvalitétsutveckling som olika verksamheters förmåga att bedöma lämplighet i forskning innan implementering (Sager och Bohlin, 2011, s. 93). 7.3 Önskvärt hanterande av mångfalden av alternativa evidensdefinitioner utifrån svenska forskningsperspektiv Skepsisen mot Cochrane-formatet som framträder i litteraturen har som ovan nämnts haft en effekt på hur man inom olika verksamheter valt att förhålla sig till evidensbegreppet. Försöken att föra över Cochrane-formatet från medicinen till andra verksamhetsområden har i Sverige bl.a. inneburit att betänkanden framlagts om att socialtjänsten bör evidensbaseras genom oklart definierade kombinationer av systematiska översikter, resultatdokumentation och nationella riktlinjer av kvantitativ art (Sager och Bohlin, 2011, s. 54). Inom forskningspolitiken har man tolkat bibliometrisk anslagsfördelning utifrån olika discipliners egna kvalitetsdefinitioner som en form av evidensbaserad forskningspolitik snarare än att ställa krav på specifika evidensbaserade metoder och samhällelig användbarhet (Sager och Bohlin, 2011, s. 55f samt 64). Folkhälsovetenskapen, ekologin och klimatforskningen har i sin tur av såväl etiska som metodologiska skäl, bedömt såväl McMastergruppens som Cochrane-samarbetets respektive evidenshierarkier som orealistiska för ändamålsenlig forskning inom fältet. Här har istället retrospektiva epidemiologiska undersökningar och andra former av observationsstudier i stor utsträckning inkluderats i systematiska översikter, metaanalyser och andra former av syntetiseringar av data (Sager och Bohlin, 2011, s. 56-59). Olika verksamheter betraktar alltså olika former av vetenskap som legitima och tre upplevda kunskapsområden kan härmed avtecknas; Evidensbaserade, allmänt vetenskapsbaserade och databaserade. I ljuset av detta har det blivit relevant för den vetenskapliga debatten att definiera vad det är för typ av metoder som man betraktar som vetenskapligt legitima och inte i olika kontexter (Sager och Bohlin, 2011, s. 64f) Författarna spenderar huvuddelen av böckerna åt att kritisera och problematisera Cochraneformatet, men Levinsson, Sager och Bohlin delger också perspektiv på problemen med mångfalden av alternativa evidenshierarkier och med de krav på vidgning eller breddning av evidensbegreppet som uppstått som ett svar på evidensrörelsens förfäktande av Cochrane-formatet. Utifrån dessa perspektiv delger de vad de själva ser som önskvärda vägar framåt utifrån den mångfald av Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 evidensdefinitioner som uppstått. Nedan beskrivs dessa alternativ och vad författarnas tankar kring dessa är. 7.3.1 Hantering av alternativa evidenshierarkier genom modifierad critical appraisal Som en följd av de upplevda lämplighetsproblemen med Cochrane-formatet har det som ovan nämnts inom olika organisationer upprättats kompletterande evidenshierarkier som sinsemellan har diametralt olika syn på vad evidens faktiskt är för något (Levinsson, 2013, s. 34). Medan det inom socialstyrelsen, SBU och Läkemedelsverket har ansetts finnas en tillräckligt stor extern validitet i RCTer sammanställda i systematiska översikter för att utgå från Cochrane-formatet i sin evidenshierarki (Nilsen, 2014, s. 46f) så har andra verksamheter använt sig av evidenshierarkier som ansetts anpassade till de specifika fälten, såväl vetenskapligt som praktiskt. En ansedd modell är den så kallade GRADE-modellen, eller ”Grading of Recommendation Assessment, Development and Evaluation” som Statens beredning för medicinsk utvärdering (SBU) valt att beakta (Sager och Bohlin, 2011, s. 213). Denna modell vidgar evidensbegreppet, b.la. genom att uppvärdera observationsstudier, och lägger vidare fokus på olika former av kvalitetskriterier i studiers design såsom publiceringsbias, stickprovsstorlek, effektstorlekar, osäkerhet i resultaten och störningsfaktorer (confounders). En annan modell på frammarsch är 6S-modellen vilken betonar värdet i att göra forskningsresultat så kortfattade och lättillgängliga som möjligt för yrkesverksamma. För att åstadkomma detta är evidenshierarkin strukturerad på så sätt att den form av forskningssammanställning som är mest omfattande och förbedömd, så kallade datorsystem för beslutsstöd där såväl sammanställningar av systematiska översikter som evidensbaserade riktlinjer ingår, hamnar i hierarkins topp medan enskilda RCTer vilka ännu inte tolkats kritiskt hamnar i hierarkins bottenskikt (Nilsen, 2014, s. 48). 6S-modellen är alltså diametralt motsatt McMastergruppens fokus på kontextuell critical appraisal, och istället inriktad på evidenskonsumtion, vad förfäktare för McMaster-gruppens modell kallat ”the easy fast food option” (Nilsen, 2014, s. 36), i syfte att överbrygga det gap mellan forskningsresultat och praktiskt utförande som beskrivits som evidensrörelsens huvudsakliga problemformulering. Inom vårdsektorn finns som en följd av nya evidenshierarkier en mångfald av systematiska översikter av kvalitativa studier. Dessa förefaller följa två grundteorier; subjektiv idealism och naiv realism. Medan subjektiv idealism utgår från att utforskning av oklara förhållandens komplexitet är forskningens mål, utgår den naiva realismen från att forskningens mål består i att genom rigorös metodologi besvara konkreta frågor och ge konkreta tillämpningsbara svar på dessa frågor. Exempel på syntetiseringar inom den subjektiva idealismen är metastudier, metanarrativ, metaetnografier och kritisk tolkningssyntes. Inom den naiva realismen sysslar man istället med tematiska synteser, ramverkssynteser och ekologisk triangulering (Levinsson, 2013, s. 32). Levinsson menar att tillkomsten av alternativa evidenshierarkier har föranlett att forskningsläget blivit motsägelsefullt i takt med att olika mäklarorganisationer har börjat producera systematiska översikter utifrån fundamentalt olika vetenskapskriterier. Han menar att detta exempelvis har fått till följd att forskning utifrån olika evidenshierarkier har funnit formativ bedömning vara såväl överväldigande positiv som direkt skadlig för elevers skolresultat (Levinsson, 2013, s. 101). Att det i denna mångfald av systematiska översikter, utöver renodlade och blandade former av kvantitativa och kvalitativa studier, också föreligger skillnader i synsätt på hur studierna ska ha bedrivits och hur de ska sammanställas på ett relevant sätt för att anses kvalificerade för inkludering i systematiska översikter, föranleder enligt Levinsson svårigheter med att hantera materialet ute i verksamheterna. Försök att göra detta menar Levinsson i sig har skett genom uppkomsten av nya former av systematiska översikter; så kallade metasynteser, som studerar hur skillnader mellan olika former av studier ger missvisande och förenklade resultat (Levinsson, 2013, s. 31f). Sager och Bohlin påpekar i likhet med Levinsson att uppkomsten av alternativa evidenshierarkier inom komplexa Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 verksamhetsområden, har ersatt Cochrane-formatets reduktionistiska stringens med de alternativa formernas vaga relevans. Sager och Bohlin drar därmed slutsatsen att varken det strikta Cochraneformatet eller mångfalden av alternativ evidens i sig själva är gynnsamma för verksamheters strävan efter ändamålsenlig, implementerbar och trovärdig evidens, något som utvecklas nedan (Sager och Bohlin, 2011, 211f). Levinsson menar med hänvisning till tvetydigheten i de budskap kring formativ bedömning som frammanats av mångfalden av evidensdefinitioner, liksom med hänvisning till sina och andras studier av problemen med formativ bedömning, att det behöver komma till stånd bättre möjligheter för lärare att själva kunna kritiskt granska och sålla i denna mångfald av systematiska översikter. Detta skulle menar han skulle kunna ske genom en modifiering av den ovan beskrivna proceduren för critical appraisal. Denna modifierade version menar han bör fokusera på bedömandet av systematiska översikter snarare än primärstudier (Levinsson, 2013, s. 32, 101f). Alltså en form av upprepad professionsbunden critical appraisal där läraren bedömer forskarbedömd forskning. För att en sådan typ av verksamhet ska kunna införas menar Levinsson att det dock behövs rejäla kursändringar hos de parter som har makt över skolutvecklingen och som i paniken över PISAresultaten tolkat evidensbaserad praktik som praktiserandet av en form av okritisk evidenskonsumtion (Levinsson, 2013, s. 103). Levinsson anser också att det krävs ökade resurser till skolverksamheten, ett fokus hos skolforskningsinstitutet på att aktualisera systematiska översikter för den svenska kontexten liksom en lärarutbildning som premierar kritiskt hanterande av forskning snarare än forskningskonsumtion för att hantera situationen. Något som han ironiskt nog anser hindras av att lärarutbildningen numera anser att konsumtionsuppsatser av den typ som här föreligger uppbär legitimitet nog att klassas som examensarbete (Levinsson, 2013, s. 102f, 106). Sager och Bohlin ser också en modifierad form av critical appraisal som en lösning på problemet med de vaga evidensdefinitionerna som de alternativa evidenshierarkierna medfört. I detta menar Sager och Bohlin att det är centralt att den professionelle delges kompetens nog att kunna identifiera vilka frågor olika evidenshierarkier kan besvara samt vilka brister de har (Sager och Bohlin, 2011, s. 217, 224). De åberopar här att offentlig sektor för att åstadkomma detta bör tillämpa vad vetenskapsforskaren Harry Collins kallar för socialisationsmodellen där vetenskaplig praktik betraktas som en effekt av social interaktion med expertis, snarare än som en effekt av formaliserade riktlinjer. Detta för att i ljuset av det oklara läget med de olika evidenshierarkierna kunna säkerställa att forskningen både håller hög kvalitet och knyter an till de kontextuella förutsättningarna på ett gynnsamt sätt (Sager och Bohlin, 2011, s. 221). 7.3.2 Hantering av vidgade och breddade evidensdefinitioner genom modifierad critical appraisal Sager och Bohlin menar vidare i det avslutande kapitlet i deras antologi att antologin synliggjort två diametralt motsatta definitioner av evidens; en konkret snäv definition i enlighet med Cochraneformatet och en abstrakt öppen definition där flera evidenstyper räknas in. Båda evidensdefinitionerna menar Sager och Bohlin bär på inneboende problem för den evidensbaserade praktiken. Medan Cochrane-formatet delger tydlighet och metodologisk stringens så medför det som ovan nämnts också en betydande förenkling av den praktiska kontexten. Den öppna definitionen medför på motsvarande sätt en teoretiskt gynnsam metodologisk pluralism men samtidigt också vaga implikationer för den praktiska verksamheten, något vars effekt i Sverige behandlats ovan. Utifrån detta menar Sager och Bohlin att varken Cochrane-formatet eller den öppna definitionen är önskvärda val för uppnåendet av evidensbaserad praktik (Bohlin, 2011, s. 211). Sager och Bohlin presenterar istället två möjliga lösningar på dilemmat som presenterats; ett vidgande av Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 evidensbegreppets innebörd respektive ett breddande av vilken forskning som ska anses kompletterande till Cochrane-formatets strikta evidensdefinition (Bohlin, 2011, s. 212f). Idén om ett vidgande av evidensbegreppet menar Sager och Bohlin redan har fått genomslag inom främst samhälls- och humanvetenskapliga områden så som socialt arbete och pedagogik, samt inom de administrativa och policymässiga delarna av medicinen. Inom pedagogiken och det sociala arbetet har man också enligt Sager och Bohlin valt att konkret vidga evidensbegreppet genom att ge kvalitativa studier, exempelvis intervjustudier och etnografiska fältstudier, likvärdig status (Sager och Bohlin, 2011, s. 213f). Levinsson ser också ett vidgande som ett tänkbart sätt att förena lärardriven forskning och Cochrane-formatet. Något han menar skulle stärka kontaktytorna mellan forskning och yrkespraktik. Tillsammans med evidensbaserad praktik anser Levinsson således att så kallad aktionsforskning kan bidra till en mer vetenskapsgrundad skola på pluralistiska premisser (Levinsson, 2013, s. 92f samt 106f). Den andra modellen, att bredda vilka forskningstyper som ska anses vara komplementära till Cochrane-formatets evidensdefinition, har enligt Sager och Bohlin gått under namnet ”kunskapsbaserad praktik”. Idén bygger på att Cochrane-formatets evidensdefinition kompletteras med vad man kallar för ”övrig vetenskaplig kunskap” samt ”data” (Sager och Bohlin, 2011, s. 215). En tredje hållning förfäktas slutligen av Sager och Bohlin som går ut på ett minskat fokus på definitioner av lämplig vetenskap och ett ökat fokus på vilka för- och nackdelar som olika typer av vetenskap har i relation till olika mål, samt vilka metodologiska begränsningar de har (Sager och Bohlin, 2011, s. 216). I sitt kapitel i Sager och Bohlins antologi drar Bergmark och Lundström också slutsatsen att deras fynd kring RCTers brist på ändamålsenlighet inom socialt arbete, liksom deras upptäckter av förvirring kring evidensbegreppets definitioner, motiverar detta problematiserande förhållningssätt till evidensbegreppet (Sager och Bohlin, 2011, s. 181f). De menar att det oreflekterade vidgandet av evidensbegreppet som ägt rum är problematiskt, men enbart i den utsträckning det inte tydliggörs vilka olikheter som föreligger mellan olika definitioner av evidensbaserad praktik (Sager och Bohlin, 2011, s. 164f). Som exempel på olikheter som uppbär stor relevans för olika evidensdefinitioners för- och nackdelar tar Sager och Bohlin upp motsatsparet som varit högaktuellt i debatten om hur god evidens ska definieras och som genomgående varit i fokus i detta arbete; d.v.s. metodologisk stringens kontra praktisk relevans. Sager och Bohlin menar att RCTer för att vara gångbara som metod kräver att deras populationsurval och deras testsammanhang är generaliserbara på kontexter som inte är ideala, något som av naturliga skäl är svårt att uppnå genom metoden. Registerstudier menar de har den höga externa validitet som RCTer saknar, som en följd av att de statistiskt säkerställt generellt gällande sannolikheter. Samtidigt kräver registerstudier en stor mängd data, en varierad population samt tydliga effekter för att kunna anses generaliserbara. Registerstudier tenderar således enligt Sager och Bohlin p.g.a svårigheten i detta delge otydliga svar kring lämplig praktik (Bohlin, 2011, s. 218f). Sager och Bohlin menar att följden av RCTers och registerstudiers inneboende problem är att det inte går att uttala sig generellt om någon lämplig balans mellan metodologisk stringens och resultatens relevans för lokala kontexter. I och med detta menar de att evidenshierarkier i allmänhet ger förenklade bilder av vad god evidens är för något. Något som aktualiserar den bild som angetts ovan av att den lämpliga evidensen bör identifieras genom ett brett fokus på olika evidenstypers detaljer i relation till för- och nackdelar också i relation till hanterandet av vidgade och breddade evidensdefinitioner. Som ovan nämnts tänker sig Sager och Bohlin att detta ska ske genom bildandet av en modifierad form av critical appraisal att identifiera dessa särarter. Sager och Bohlin menar att detta bör ske utifrån pragmatism och beaktande av olika verksamheters ambitioner (Sager och bohlin, 2011, s. 223ff). Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 7.4 Rimligheten i antagandet om att objektiv evidens existerar utifrån socialkonstruktionistiska forskningsperspektiv Gemensamt för såväl den kritiserade evidensrörelsen och den ovan avhandlade litteraturen är strävandet efter den mest vetenskapligt trovärdiga definitionen av evidensbegreppet. Ambitionen att vetenskapsgrunda olika verksamheter är därmed alltjämt i fokus. Jag anser att idén om relativism aktualiseras som en följd av den ambivalens som identifierats ovan, vars lösningar anges vara balansakter mellan olika syn på relevant evidens. Med detta avser jag att anledningen till att balansakter vid ett neutralt studium av rimligheten i olika evidensdefinitioner, framstår som den enda lösningen, kan bero på att det bara existerar relativt giltig, socialt konstruerad kunskap i relation till psykosociala verksamhetsområden. Bruno Latour och Steven Wollgar står bakom en relativistiskt präglad vetenskapssociologisk fältstudie som trots sin ålder ännu idag uppbär relevans för studiet av huruvida vetenskap i allmänhet har förutsättningar att frammana sådana objektiva sanningsanspråk som i evidensdebatten varit det centrala målet. Liksom Helgesson identifierar de sociala processer som navet i den vetenskapliga produktionen av faktum. I sin studie utgår de tu från en mycket långtgående version av den socialkonstruktionistiska vetenskapssociologin vilken föreskriver att alla former av försök att utröna objektiva vetenskapliga betingelser i själva verket innebär en social konstruktion av dessa betingelser. Vetenskap ses som en följd av detta av Latour och Wollgar som blott en av många arenor för kunskapsproduktion (Latour och Wollgar, 1986, s. 31). Som en följd av detta undviker de att särskilja det mikrosociologiska common sense-begreppet från vetenskap och vidmakthåller att samma typ av rationaliserande är drivande i såväl vardag som i den vetenskapliga praktiken. Latour och Wollgar tar därmed avstånd från Harold Garfinkels klassiska modell för vad som räknas som common sense-kunskap och vad som räknas som vetenskaplig kunskap och menar att distinktionen dem emellan inte finns. (Latour och Wollgar, 1986, s. 153). Detta menar Latour och Wollgar har tre följder; Likhet och olikhet är socialt konstruerade distinktioner, inte naturligt givna företeelser, teknik och socialitet behöver inte särskiljas och det behöver inte heller fakta och artifakter (Latour och Wollgar, 1986, s. 253). Anledningen till dessa följder menar Latour och Wollgar är att sinnesobservationer sorteras i enlighet med föreliggande sociala förutsättningar och processer. Den sociala kontexten avgör därmed vad som uppfattas och hur, snarare än naturen självt. Därigenom omvandlas kaos till ordning (Latour och Wollgar, 1986, s. 33). Studiens syfte anges således av Latour och Wollgar vara att utreda vilka verktyg som används för att skapa denna ordning. De menar att forskares tendens att tvätta bort den process som i verkligheten ägt rum vid samtal med utomstående, ställer krav på att sätta sig in vad det faktiskt är som försiggår i det laboratorium de valt att studera (Latour & Wollgar, 1986, 28f, 36f). De kan alltså sägas ha velat skildra hur skillnader i livsvärldslogik, för att använda ett fenomenologiskt begrepp, mellan vetenskapliga och andra typer av resultattolkning i laboratoriet, skapas i syfte att framställa den vetenskapliga processen som logiskt stringent (Latour och Wollgar, 1986, s. 152) Genom detta ville de utöka det så kallade starka programmet inom vetenskapssociologin genom att gå längre än som inom det gjorts hittills. Detta åstadkommer de i sin tur genom att se vetenskapligt upptäckta objekt som varandes helt igenom socialt konstruerade företeelser (Latour och Wollgar, 1986, s. 152). I kraft av detta motsätter sig Latour och Wollgar såväl makrosociologiska och ideologiskt drivna sociologiska perspektiv på naturvetenskap i sin studie, liksom det tidigare populära studiet av misstagens sociologi, vilket omnämnts ovan (Latour och Wollgar, 1986, s. 32, 152). Det empiriska underlaget i Latour och Wollgars studie har varit en 21 månader lång studie av arbetet i ett neuroendokrinologiskt laboratorium som bedrivits genom nära daglig kontakt med forskarna i laboratoriet. Det studerade laboratoriet är enligt Latour och Wollgar känt för sin nivå av rutinisering och formalisering och de anser därmed detta vara generaliserbart till formaliserad naturvetenskap i allmänhet (Latour och Wollgar, 1986, s. 31). Studien bedrevs genom fältanteckningar, formella Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 intervjuer, analys av litteraturen använd av vetenskapsmännen på plats liksom annan dokumentation så som brev och uppsatsutkast (Latour & Wollgar, 1986, s. 18, 39, 153). Latour och Wollgar har också försökt analysera samtal men har inte använt sig av den standardiserade formen av sådan analys (d.v.s. inspelade samtal). Istället används anteckningar, kroppspråksanalys, timing och tonation (Latour och Wollgar, 1986, s. 154). De tu beskriver genomgående sin studie som varandes antropologisk och betonar därmed ambitionen att liksom socialantropologer traditionellt sett gjort i relation till ursprungsbefolkningar, komma till botten med den common sense som präglar de studerade vetenskapsmännens upplevelser. Detta har skett genom deltagande observation i enlighet med socialantropologisk tradition där en del av processen att förstå vad som pågår i laboratoriet har varit att se på situationen i sin helhet som i sig självt främmande, d.v.s. som en kontext där inga förgivettaganden eller accepterande av vedertagna faktum får äga rum. En del i detta menar Latour och Wollgar är att upplösa distinktionen mellan det tekniskt och det socialt logiska, så som ovan omnämnts (Latour & Wollgar, 1986, s. 27f, 29f). Genom levd erfarenhet som laboratorietekniker, öppen observation, samverkan och informering av deltagare har Latour och Wollgar med hjälp av metoderna omnämnda ovan, försökt leva sig in i de studerade forskarnas verklighet (Latour och Wollgar, 1986, s. 40). Latour och Wollgar kallar aldrig sin metod för vad som inom vetenskapssociologin kallas etnometodologi, men motviljan gentemot funktionalismen liksom idéerna om social konstruktion som allenarådande inom vetenskapen, indikerar starkt att Latour och Wollgars monografi syftar till att bryta med det inom vetenskapssociologin förhärskande starka programmets något mildare syn på möjligheterna till objektiv vetenskap till förmån för en mer etnometodologisk inställning (Latour och Wollgar 1986, s. 32). Steve Wollgar tillskrivs också titeln etnometodolog i Per Månssons bok Moderna samhällsteorier medan själva studien i fråga beskrivs som en etnometodologisk klassiker (Månsson, 2007, s. 211, 213). Det som talar emot denna klara definition är Latour och Wollgars konsekventa skildringar av sociala förhandlingar om verkligheten där nivå av trovärdighet, eller credibility, något som förefaller tangera Pierre Bourdeaus kapitalformsbegrepp, avgör vilka påståenden som successivt omvandlas till faktum inom forskningsfältet. Något som förefaller antyda spår av nätverksteori. Studien är i kraft av sin ålder inte en studie om de allra modernaste forskningsmetoderna så som RCTer och systematiska översikter, men belyser påtagligt den form av logik som legat till grund för och underbygger dessa metoder och vetenskaplig metod i allmänhet. 7.4.1 Vetenskapliga studiers trovärdighet som evidens Latour och Wollgars studie, vilken refereras till av Helgesson, tangerar Helgessons resonemang kring fas 4-RCTer i relation till hur subjektiva bedömningar vilka bl.a. drivs genom beaktande av eminens, döljs genom olika former av datatvätt. Latour och Wollgar tycker sig under sin studies gång ha observerat hur de studerade forskarna använt sig av konstruerad så kallad ”fenomenoteknik” för att åstadkomma denna datatvätt. Med fenomenoteknik avser Latour och wollgar metoder som möjliggör upplevelsen av att objekt existerar objektivt, d.v.s. har vad författarna kallar för en ”out thereness”. På detta sätt har forskarna enligt Latour och Wollgar genom sociala och intellektuella processer lyckats socialt konstruera maskiner som ger ett sådant intryck. Dessa maskiner, och annan skapad utrustning, är således enligt Latour och Wollgar sociala intellektuella konstruktioner på samma sätt som forskningen som använder dem i sig. På detta sätt kan artificella kopior av påståenden skapas som ger dessa påståenden en känsla av existens utanför påståendena (Latour och Wollgar, 1986, s. 64, 238, 176). Liksom Helgesson menar Latour och Wollgar således att bevisen för denna sociala konstruktion raderas. Detta samtidigt som betydelsen av de uppmätta effekterna överdrivs. Utifrån observationerna av detta menar Latour och Wollgar att det logiska individuella tänkande som brukar framställas som grunden för vetenskaplig verksamhet, i själva verket är grundat i sociala sammanhang (Latour och Wollgar, 1986, s. 173f). Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Latour och Wollgars fortsatta resonemang om det sociala sammanhanget knyter an till Helgessons observation av hur dolda subjektiva bedömningar utgör en naturlig del av den kvantitativa forskningsprocessen i en fas 4 -RCT. Latour och Wollgar menar att de informella samtal som de observerat till skillnad från laboratoriets skriftliga redogörelser, delger en empirisk bild av hur den vetenskapliga processen går till då den inte har tvättats bort genom utebliven redogörelse eller formalisering. De menar därmed att informellt kommunicerad information är det ledande medan formell sådan blott utgör ett undantag i syfte att legitimera den informella processen (Latour och Wollgar, 1986, s. 168, 252). Här observeras alltså samma fenomen som i Helgessons studie. Latour och Wollgar breddar dock den bild som Helgesson uppmålat av vilka sociala processer som underbygger dessa informella påverkansfaktorer, och lanserar ett beskrivande begrepp för vad de menar att det egentliga syftet med vetenskaplig verksamhet är; att cirkulera i den så kallade kredibilitetscykeln. 7.4.2. Den sociala konstruktionen av framgångsrika vetenskapsparadigm Figur 2 Latour och Wollgars kredibilitetscykelsmodell (Latour och wollgar, 1986, s. 201) Kredibilitetscykeln är enligt Latour och Wollgar en central del av meningen med verksamheten i laboratoriet de studerat. Denna cykel består av sex delar som gås igenom i tur och ordning; Erhållande av vetenskapligt erkännande, erhållande av anslagspengar, erhållande av utrustning, produktion av data, argumenterande för data samt artikelskrivande om resultatet av denna argumentation. Dessa delar gås igenom cykliskt tills forskaren trillar ur som en följd av brist på erkännande (Latour & Wollgar, 1986, s. 201). De studerade forskarnas primära ambition är enligt Latour och Wollgar att försöka effektivisera resan genom kredibilitetscykeln då detta förstärker bilden av deras vetenskapliga briljans. Detta menar Latour och Wollgar sker genom strategiska val av forskningsinriktning, kollegor, problemområden, metoder, hypoteser o.s.v. (Latour & Wollgar, 1986, s. 206f). På detta sätt menar de att forskaren positionerar sig strategiskt för att genomgå cykeln. Karriärväg, fältets situation, resurstillgång och positionens fördelar blir därmed verktyg som används för att vinna kampen om effektiv cykelgenomgång. Forskarnas positioner blir på detta sätt enligt Latour och wollgar också socialt konstruerade i och med att de mer är föremål för sociala strategier än objektiva förtjänster (Latour & Wollgar, 1986, s. 212f). Latour och Wollgar menar slutligen att forskarna i denna process använder sin trovärdighet som kapital som konsekvent investeras i Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 kredibilitetscykeln i syfte att uppnå mer trovärdighet (Latour & Wollgar, 1986, s. 197f). Kredibilitetscykeln utgör härmed en modell som indirekt synliggör varför just kvantitativ metodologisk stringens fått sådant anseende i debatten om lämpliga evidensdefinitioner. Detta genom att den illustrerar hur styrkan i forskningsparadigm vilar på hur enkelt det är att bekräfta paradigmets giltighet, något som rimligen förenklas av att subjektiviteten i forskningen döljs så som ovan beskrivits. Enkelheten i att bekräfta ett forskningsparadigms giltighet är utifrån detta avgörande för hur mycket pengar som investeras i det och hur många forskare som väljer att befinna sig i det. En central del av försöken att vara i kredibilitetscykeln menar Latour och Wollgar är att bedöma personers trovärdighet, något som knyter an till Helgessons beskrivning av eminens som verktyg för att socialt reda ut avvikelser i mätdata. Anledningen till att detta utgör en central del av genomgåendet av kredibilitetscykeln menar de är att forskarna är beroende av varandras förmåga att vara i cykeln för att själva kunna vara det (Latour & Wollgar, 1986, s. 202f). De ger ett antal konkreta exempel på hur detta går till socialt. Det första fallet de observerar är ett socialt utbyte mellan forskare som syftar till att stärka vissa påståenden och försvaga andra påståenden. Detta genom hänvisande till starkare påståenden och den påstående forskarens tidigare misslyckanden med att kvarstanna i kredibilitetscykeln, d.v.s. dennes oförmåga att stärka sina påståenden genom övertalning (Latour och Wollgar, 1986, s. 155). Det andra fallet de observerade var hur två forskare sinsemellan försökte reda ut vad som är det mest strategiska sättet för dem att bedriva ett samarbete. Centralt i detta sociala utbyte var resonemang kring vilka peptidkvantiteter som föranleder ett bra motangrepp mot påståendet att injicerade peptider har en psykobehavioristisk effekt. I fokus för forskarna stod här enligt Latour och Wollgar alltså inte bara själva bidraget till kunskap, utan också viljan att effektivt genomgå kredibilitetscykeln. Detta menar de pekar på att påståenden inte är objektiva utan snarare drivna av intresset av att stanna i cykeln. Det tredje fallet Latour och Wollgar observerade utgjorde ett exempel på att forskarna utöver rena förhandlingar om påståendens giltighet, av praktiska skäl också måste göra bedömningar om hur forskningen ska bedrivas utifrån vad de anser är acceptabel professionell praktik, hur mycket tid och resurser som finns tillgängliga samt hur stora riskerna för framtida vetenskaplig kritik är (Latour och Wollgar, 1986, s. 159). I det fjärde fallet observerade de hur sådan rationalisering av sätt att kvarstanna i kredibilitetscykeln, kan bli trumfad av en ovilja att ifrågasätta påståenden som en följd av att dessa påståenden förvisso riskerar ha svårt att stanna i kredibilitetscykeln men samtidigt omhuldas av forskare med högre nivåer av trovärdighet (Latour och Wollgar, 1986, s. 161f). Som en följd av detta drar Latour och Wollgar slutsatsen att också auktoritära påståenden kan bli vägledande som en följd av svårigheter att definiera alternativa påståenden på samma trovärdighetsnivå, något som också Helgesson observerat. Likväl kan, som beskrivs nedan, språkbruket i en artikel, bruk av fotnoter eller argumentationsteknik vid övertyganden försvåra alternativa påståenden. Sammanlagt innebär detta enligt Latour och Wollgar, att trovärdighetsnivå samt social förhandling driver ”common sense”, d.v.s. subjektivt förnuft, på samma sätt som i vad man inom fenomenologin kallar för ”livsvärlden” (Latour och Wollgar, 1986, s. 156ff). Latour och Wollgar liknar den observerade sociala processen vid ett spel, där poängen är att utvärdera vilka investeringar som krävs för att driva igenom ett påstående samt vilken avkastning som denna investering får i slutändan. De menar därmed att etiska forskningsregler är mindre relevanta för de observerade forskarna än detta spel (Latour och Wollgar, 1986, s. 243). I deras femte observerade fall illustreras denna slutsats tydligt genom att Latour och Wollgar observerar hur data producerad av en forskare med låg trovärdighet avfärdas av forskare med högre trovärdighet för att dessa ska undvika risken att falla ur kredibilitetscykeln. Detta fenomen, vilket Latour och Wollgar klassificierar som en typ av common sense-psykologi/sociologi, menar de har varit mycket vanligt förekommande under deras studie (Latour och Wollgar, 1986, s. 163f). Utifrån dessa och andra observationer av det sociala samspelet har Latour och Wollgar observerat fyra diskussionstyper som i Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 laboratoriet konsekvent används i syfte att socialt konstruera objekt i enlighet med kredibilitetscykelns krav: Informationsutbyte om vilka påståenden som stabiliserats, d.v.s. uppnått faktastatus, Tekniska påståenden om forskningsmetod, Teoretiska påståenden och slutligen strategiska bedömningar av personers trovärdighet (Latour och Wollgar, 1986, s. 160-164). De identifierar också en rad särdrag i den sociala interaktionen: Många separata intressen präglar samtalen, rent tekniska, deskriptiva och teoretiska samtal är sällsynta och forskarnas tankeprocesser är inte heller i någon större utsträckning annorlunda än vardaglig common sense. Latour och Wollgar drar slutsatsen att dessa observationer stödjer teorin om den sociala konstruktionen (Latour och Wollgar, 1986, s. 166). Det sociala samarbetets funktion för skapandet av upplevt objektiv vetenskap inom det forskningsparadigm som Helgesson studerat i en fas 4 –RCT, utvecklas alltså i Latour och Wollgars studie till att innefatta en social kamp om att åstadkomma detta och därmed successivt belönas med allt högre nivåer av trovärdighet. I såväl Helgessons studieobjekt som i Latour och Wollgars sådana syftade därmed den sociala konstruktionen av objektiva fakta mer till att bekräfta forskarnas liksom de utomståendes uppfattning om forskningens vetenskaplighet än till att sträva efter verklighetsförankring i resultaten. 7.5.3. Forskningssammanställningars trovärdighet som evidens Latour och Wollgars studie ger trots att den inte specifikt behandlar dem, perspektiv på såväl registerstudier som metaanalyser och systematiska översikters inneboende logik så som dessa grundas i naturvetenskaplig kvantitativ metod. På samma sätt som data enligt Latour och Wollgar tvättas ren från spår av subjektiv påverkan under forskningens gång genom fenomenoteknik och informella sociala processer, så finner de att uppnådda resultat av detta tvättande också i sin tur tvättas rent från eventuella spår av subjektivism. Inskriptionsmaskiner och annan använd laboratorieteknik, tas därmed för given eller glöms helt bort. Genom detta menar de att den vetenskapliga processen glöms bort när väl resultaten har uppnåtts och att data därmed anses härstamma ur en objektiv källa, fri från subjektiv påverkan. På så sätt fastställs illusionen om ett faktum (Latour och Wollgar, 1986, s. 63). Systemet för detta utvecklade osynliggörande menar Latour och Wollgar bottnar i formalisering, liksom det ursprungliga osynliggörandet. När verksamheten i laboratoriet formaliseras och rutineras menar de att det blir möjligt för forskarna att bortse från fenomenoteknikens långa konstruktionsprocess, samt dess materiella förutsättningar. Istället beskrivs tillkomsten av objekt som produkten av idéer, teorier och anledningar medan laboratoriets praktiska och materiella verksamhet glöms bort. Latour och Wollgar menar att detta innebär att det trots att det är just de materiella konstruktionerna som skapar fenomenen och gör det möjligt att säga att saker existerar, så ges mycket liten uppmärksamhet åt dessa konstruktioner i den traditionella redogörelsen för vetenskapliga händelseförlopp (Latour och Wollgar, 1986, s. 69). Utifrån resonemanget kan man hävda att det sätt på vilket de påståenden och studier som ingår i metaanalyser, systematiska översikter och andra forskningssammanställningar successivt glöms bort, så glöms också de påståenden och studier som legat till grund för konstruktionen av en maskin. Ovan har beskrivits hur forskarna socialt konstruerar sina forskningsfynds objektivitet genom datatvätt som driver fram en glömska kring forskningens tillblivelse. Latour och Wollgar introducerar i denna process en central variabel, nämligen övertalningen. Utöver skapare av fenomenoteknik i form av maskiner menar Latour och Wollgar att forskarna är skickliga övertalare. Detta menar de innebär att forskarna är skickliga på att övertala/övertyga utomstående om att det de gör är viktigt, sant och värt att finansiera, samt att de utomstående inte alls blir övertygade utan bara presenteras en serie logiskt konsekventa bevis. Andra forskare övertalas därmed enligt Latour och Wollgar att de inte övertalats och att det är onödigt att därför beakta gråskalor mellan upplevelser. Latour och Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Wollgar menar att övertalandet/övertygandet artar sig som så att även utomstående övertalas/övertygas om att de materiella förutsättningarna saknar relevans och att resultaten kan betraktas som fakta (Latour och Wollgar, 1986, s. 70). Utöver den informella övertalningsprocessen sker enligt Latour och Wollgar övertalningar konkret genom annan fenomenoteknik än maskiner; d.v.s. genom skriftliga framställningar. De menar att de funnit att de texter som forskarna använder för att rapportera om sina fynd till utomstående, är en form av övertygande genom ett osynliggörande av framställningens avsikt att övertyga. Genom ett formspråk som utstrålar objektiv faktaåtergivning kan läsaren av texten enligt Latour och Wollgar övertygas utan att själv märka att det är just det som har skett. På detta sätt menar de att påståenden som tidigare varit föremål för kontrovers och debatt, kan framställas som oproblematiska och oemotstridliga faktum. Påståenden kan enligt Latour och Wollgar också stagnera på så sätt att de inte leder till nya fynd eller att de förintas genom att andra påståenden gjorda av aktörer med högre nivå av trovärdighet motsäger dem. Slutligen menar Latour och Wollgar att påståenden genom återanvändande av andra snabbt solidiferas och blir nästintill obestridliga. De ingår då i uppbyggnaden av en maskin eller i kurslitteratur och undgår kritisk granskning (Latour och Wollgar, 1986, s. 87). Om maskiner producerar samma effekt under samma förhållanden och om denna likhet bekräftas socialt genom påståenden, så menar Latour och wollgar att effekten får status som ”out there”, d.v.s. objektiv. Samma sak menar de är fallet med påståenden och texter; om olika forskare frammanar samma påståenden så ses det som en indikation på att man talar om något ”out there” (Latour och Wollgar, 1986, s. 83f). Den observerade cirkulära processen är således enligt Latour och Wollgar att konflikter mellan påståenden leder till att vissa påståenden vinner medan andra förlorar utifrån trovärdighetsnivå. De vinnande påståendena publiceras sedermera som fakta och dessa litterära versioner av påståendena ligger till grund för byggandet av maskiner eller utformandet av läroböcker. Maskiner och läroböcker används och producerar mätdata i enlighet med de påståenden som legat till grund för dem. Dessa mätdata blir föremål för nya konflikter mellan påståenden. Vinnande påståenden publiceras som fakta o.s.v. (Latour och Wollgar, 1986, s. 87). Den solidifiering av vetenskapliga påståenden genom sociala bekräftelser som Latour och Wollgar här påtalar kan rimligen i högsta grad anses applicerbart på vetenskap i största allmänhet. Latour och Wollgar menar också att konstruktionen av fakta, eller av ”verkligheten”, förstärks av att de påståenden som stabiliserats av höga nivåer av trovärdighet hos de som drivit dem, återintroduceras i laboratoriet som vedertagen utrustning och forskningsprocedur. På detta sätt blir trovärdighetskostnaden till slut så hög att paradigmskiften genom nya påståenden blir nästan omöjliga (Latour och Wollgar, 1986, s. 243). De exemplifierar hur detta har skett genom hänvisning till två maskiner vilka uppbär olika mängd trovärdighet utifrån dess tillkomstprocess i enlighet med det ovan nämnda; mass-spektrometern och tunnlagerkromatografin. Medan mass-spektrometern bygger på majoriteten av tidigare forskning inom en del av fysiken är tunnlagerkromatografin mycket omstridd. Detta menar Latour och Wollgar medför att det är mycket kostsamt att uppnå tillräcklig trovärdighet för att ifrågasätta de påståenden som mass-spektrometern frammanar, medan tunnlagerkromatografins påståenden lätt kan bemötas med andra påståenden. Detta menar de i sin tur beror på att de tidigare påståenden som mass-spektrometern bygger på, har tvättats bort, d.v.s. de ingår i vad Latour och Wollgar kallar för en ”svart låda” som ger skenet av faktastatus. Innehållet i denna låda är mycket kostsamt att ifrågasätta trovärdighetsmässigt, d.v.s. det kräver minst motsvarande nivå av trovärdighet som redan investerats för att lyckas. Pengar, auktoritet, självförtroende och belöning menar de i detta är centrala begrepp. Följden är att välutvecklade vetenskapliga paradigm tenderar att bestå också av denna anledning (Latour och Wollgar, 1986, s. 242). Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Latour och Wollgar illustrerar och förtätar bilden av denna process genom att hänvisa till hur ett ”objekt” konstruerats av forskare inom neuroendokrinologin; det tyreotropinfrisättande hormonet (TRH). Latour och Wollgar menar att TRH, liksom vetenskapliga objekt i allmänhet gör, började sin resa till faktastatus genom att kriterier för likhet och urskiljande av repeterbarhet av denna likhet möjliggjorde avfärdande av avvikelser/artifakter som bakgrundsbrus (Latour och Wollgar, 1986, s. 126). De menar att vetenskapens själva definition av verkligheten är ett sorterande, i vilket socialt etablerade signaler utgör likhetsnorm för eftersökta signaler. Detta i syfte att ordna upp en oordning som utgör regel snarare än undantag i vetenskapliga sammanhang. Denna regel innebär enligt Latour och Wollgar att det faktuella bakgrundsljudet blott producerar kaos, medan själva ordningen konstrueras socialt (Latour och Wollgar, 1986, s. 246, 252). Ett objekt såsom TRH, skapas alltså enligt Latour och Wollgar av att distinkta signaler urskiljs och kontrasteras mot bakgrundsbruset av andra signaler, som genom en lång och kostsam process planats ut. Det existerar som ett verkligt faktum, men det är ett faktum som konstruerats (Latour och Wollgar, 1986, s. 127). Trovärdighetsgrundade sociala övertyganden menar de alltså bygger på klara definitioner av vad som utgör likhet och vad som i en mångfaldssituation utgör trolig/tillräcklig likhet. Skillnader och mångfalder av troligheter menar de kan förklaras bort genom datamanipulation inom normerna för bevisföring, d.v.s. genom det övertygande och den konstruktion som beskrivits ovan (Latour och Wollgar, 1986, s. 241f). Enligt Latour och Wollgar valdes TRH genom denna process ut ur en mångfald logiskt likvärdiga alternativ och blev därigenom socialt stärkt som faktum – ett konstruerat objekt (Latour och Wollgar, 1986, s. 148). Ett objekt konstrueras som ovan nämnts av bl. a. skriftliga redogörelser för inskriptioner från maskiner, men dess soliditet uppnås enligt Latour och Wollgar genom det kontinuerliga tillskottet av metod från andra erkända fält (Latour och Wollgar, 1986, s. 127). Ett fenomen som förefaller ha varit centralt för legitimerandet av olika typer av human- och samhällsvetenskapliga fält och som rimligen är centralt för den pågående uppstruktureringen av utbildningsområdets vetenskapliga grund där, som detta arbete belyser, det medicinska Cochrane-formatet angetts som en lämplig metod att låna in i kraft av dess paradigms hårdhet. Laboratorieforskarnas upplevelse av TRHs ”out thereness” bygger enligt Latour och Wollgar enbart på den sociala konstruktionen av denna upplevelse. TRH är således enligt resonemanget inte resultatet av att inskriptioner antytt dess existens, TRH som objekt/fakta är snarare identisk med inskriptionen. Således menar Latour och Wollgar att TRH inte kan ses som ett ”upptäckt” fenomen utan snarare som ett fenomen som konstruerats tack vare forskarnas kreativitet (Latour och Wollgar, 1986, s. 128f). TRH uppstod därmed som en följd av samspelet mellan två konkurrerande gruppers respektive materiella förutsättningar samt deras strategier för att kvarstanna i kredibilitetscykeln (Latour och Wollgar, 1986, s. 134). Det omvandlades sedermera från påstående till faktum år 1969. Den nioåriga process som legat bakom dennas tillväxt blev enligt Latour och Wollgar genom detta omvandlande ointressant att beakta för forskare. Hur upptäckterna gjorts och vad forskarna som gjort dem hette ansågs nu irrelevant och ointressant. (Latour och Wollgar, 1986, s. 175). Latour och Wollgar kan genom det de funnit konstatera att kombinationen av formaliserandet av trovärdighetsgrundade sociala övertyganden och materialisering av övertyganden, liksom datatvätt i syfte att datamässigt dölja denna process, medför att faktakonstruktionen effektivt döljer sitt eget tillblivande (Latour och Wollgar, 1986, s. 240). Återigen aktualiseras betydelsen av forskningssammanställningar av olika slag. Exempelvis de uppmätta effektstorlekarna av formativ bedömning som av Levinsson problematiseras i detta arbete kan utifrån resonemanget problematiseras. Genom Latour och Wollgars studie kan vi så här långt se klara implikationer för den logik som underbygger metaanalysers, systematiska översikter och andra forskningssammanställningars objektiva framtoning. Utbildningsvetenskapliga effektstudier kan utifrån resonemanget sägas bedrivas utifrån sociala övertalningar. Övertalningar som sedermera tvättas bort genom skriftliga Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 framställningar vars primära syfte är att övertyga läsaren om tydlighet i de uppmätta effekterna. Detta i syfte att underlätta för den författande forskaren med ansvariga kollegor, att kvarstanna i kredibilitetscykeln. Dessa framställningar omvandlas sedermera till effektstorlekar i omfattande metaanalyser och systematiska översikter. Den tvättade datan tvättas därmed en andra omgång. Metaanalyserna och de systematiska översikterna används sedermera som utgångspunkt för nya studier vars resultat avgörs av sociala övertalningar inom ramen för de fynd som metaanalyserna/de systematiska översikterna redan delgett som faktum. Utifrån resonemanget kan exempelvis de uppmätta effektstorlekarna i John Hatties stora metastudie tolkas som grundade i subjektiva bedömningar och intressen, samt i sociala processer och övertalningar; d.v.s i sociala konstruktioner. Sociala konstruktioner som successivt kommer att solidifieras som obestridliga faktum genom allt mer komplexa påbyggnadskonstruktioner som är svåra att uppmana tillräckliga resurser för att utmana. Att själva omfånget på Hatties studie idag tas som intäkt för dennas kvalité kan ses tala för relevansen av Latour och Wollgars studie i detta avseende. 7.5.4 Följderna för strävandet efter objektiv vetenskap Slutsatserna Latour och Wollgar drar av sina observationer är att den naturvetenskapliga forskningsmetoden som p.g.a. formalisering och datatvätt anses vara kapabel att producera objektiva faktum, i själva verket är obotligt bunden till sociala processers subjektiva skapande av skenbara faktum. I sin relativism i relation till möjligheten att upptäcka objektiva faktum är Latour och Wollgar här mycket långtgående. De menar att fakta och artifakter inte är synonyma med sant och falskt. Istället är de påståenden som befinner sig olika långt från beskrivningen av deras konstruktion. Ju längre ifrån genesis, desto mindre redogörelse för denna konstruktion. Därmed uppstår illusionen om det objektiva faktumet (Latour och Wollgar, 1986, s. 176). Att påståenden och objekt framstår som separata ting menar Latour och Wollgar enbart beror på att påståendet har misstagits för objekt. Således är det en illusion att objektiva fakta föranlett påståenden (Latour och Wollgar, 1986, s. 177). Latour och Wollgar menar härmed att fakta och verklighet förvisso existerar objektivt men bara som en följd av en social konstruktion utav dem. Som en följd av detta kan de inte existera oberoende av denna konstruktion (Latour och Wollgar, 1986, s. 181f). Latour och wollgar menar att deras slutgiltiga resonemang bär implikationer för deras egen studie i och med att denna inte kan sägas skilja sig från den forskning de observerat. Således menar de att den inte heller kan eller bör ses som objektiv, utan snarare som lika fiktiv som den vetenskapsstyp som studerats, något som tangerar också Sager och Bohlins utgångspunkt som dock är mindre relativistisk (Sager och Bohlin, 2011, s. 22). Den enda skillnaden mellan de studerade forskarna och Latour och Wollgar själva menar de består i den mindre mängd trovärdighetskapital som de haft i jämförelse med dessa (Latour och Wollgar, 1986, s. 254, 256ff). I båda fallen anser alltså Latour och Wollgar att det handlat om att konstruera fakta genom ett fastställande av likheter och skillnader, selektivt urval, eller tvättande, av data liksom slutligen en form av övertalande i skriftlig form. Detta resonemang medför att inte bara kvantitativ utan också kvalitativ forskningsmetod så som den som använts av många av författarna i den svenska litteraturen som här behandlats, är inkapabel att frammana objektiva sanningar. Likheterna i förhållningssätt menar Latour och Wollgar gör distinktioner mellan mjuk och hård vetenskap svåra (Latour och Wollgar, 1986, s. 255f). Latour och Wollgar menar vidare att det faktum att vetenskapsmän konstant reflekterar över om påståenden och metodologiska följder av påståenden faktiskt existerar objektivt, gör det orealistiskt att lämna debatten om positivism kontra relativism till filosoferna och att därmed se vetenskapen som separerad från denna debatt (Latour och Wollgar, 1986, s. 179). Argumentet om att vetenskapliga faktums användbarhet utanför laboratoriet motiverar att kalla dem verkliga oavsett filosofiska resonemang, menar de faller som en följd av att applicering av laboratoriegrundade Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 resultat utanför laboratoriet i själva verket handlar om att överföra laboratoriets teknik till andra miljöer, t ex sjukhus och inom industrin. De menar alltså att det lika lite går att säga att ett etablerat faktum inte fungerar som det går att frikoppla det från laboratoriets definition av fungerande (Latour och Wollgar, 1986, s. 182f). Ett resonemang som rimligen uppbär relevans för vetenskap i allmänhet och som summerar Latour och Wollgars studies bidrag till den vetenskapsteoretiska debatten. 8. DISKUSSION OCH SLUTSATS Som framgått av den kritik mot Cochrane-formatet som presenterats ovan så är dess evidensdefinition enligt den undersökta litteraturen varken tillräckligt trovärdig, d.v.s. internt stringent (enligt Helgesson, Latour, Wollgar, Bergström och Lundmark) eller tillräckligt ändamålsenlig och implementerbar, d.v.s. externt relevant (enligt Levinsson, Sager och Bohlin, Nilsen, Bergström och Lundmark) för att rakt av kunna tillämpas inom utbildningsområdet. Skagerströms kapitel i Nilsens antologi utgör ett undantag i det att hon identifierat en effektiv och relativt oproblematisk implementering av psykosocial evidens grundad i Cochrane-formatet. Samtidigt har implementeringen skett på en implementeringsarena som på flera sätt förefaller vara mer mottaglig för Cochrane-formatet än vad utbildningsområdet är, något som Skagerström illustrerar genom Rogers diffusionsteori. Motiverande samtal (MI) som metod är också rimligen betydligt enklare att implementera och mer kortsiktigt utvärderbar än formativ bedömning, som jag använde som utbildningsvetenskaplig referensram i redogörandet för Skagerströms kapitel. Skagerström anger också att framgångsrikt användande av MI mättes i frekvens snarare än i kontinuitet, varför liknelsen med formativ bedömning blir lidande. Av detta följer att den kontext som i Skagerströms kapitel behandlas, bör anses för olik utbildningsområdet för att tillåta en direkt jämförelse som legitimerar Cochrane-formatets implementerbarhet. Skagerström förklarar som ovan nämnts bort att implementeringen av Riskbruksprojektet inte haft någon observerbar outcome genom hänvisning till att komplementen till MI, AUDIT och tidigare möten, inte uppfyllt kraven för de högre nivåerna i den evidenshierarki som Nilsen presenterat och som utgår från Cochrane-formatet. I ljuset av Bergmark och Lundströms konstaterande om drontens domslut och RCTers oförmåga att beakta motivationsbrist, så menar jag dock att bristen på effekt också i Skagerströms studie är problematiskt för Cochrane-formatets trovärdighet. Renodlat positivistiska förhållningssätt till utbildningsområdet förefaller, i kraft av det ovanstående, orimliga. Samtidigt anser jag det inte befogat att i kraft av de fynd som gjorts i detta arbete avfärda Cochrane-formatets lämplighet för utbildningsområdet helt och hållet. Detta av flera anledningar som berör såväl ändamålsenligheten, implementerbarheten och trovärdigheten. För det första bottnar en del av argumenten mot Cochrane-formatets ändamålsenlighet som Nilsen och Levinsson tar upp, i teorier och värderingar snarare än i vetenskapligt observerade fenomen. För det andra delger materialet jag studerat få konkreta implementeringsexempel i skolan och de som delges utgår från formativ bedömning, en metod som förvisso säkrats genom systematiska översikter och som förfäktas av OECD, men som det är oklart i litteraturen huruvida den prövats genom specifikt RCTer. Dessa implementeringsfall förefaller också ha bedrivits utifrån en öppen skepsis hos Levinsson gentemot hela idén med Cochrane-formatet. För det tredje kan inte heller trovärdigheten i formatet avfärdas rakt av utifrån litteraturens resonemang. Detta av sex skäl; För det första har undersökandet av Cochrane-formatets framväxt och inre logik visat på relevansen i att beakta att det tillkom som en metod för att hantera bristen på ändamålsenlighet och trovärdighet i äldre, mer kvalitativt och kontextuellt bundna former av professionell praktik. För det andra innebär Skagerströms beskrivning av att MI inte implementerades med krav på konsekvent användande i Riskbruksprojektet, att det finns en möjlighet att detta föranlett lågt användande som inte framgått i de utvärderande enkätsvaren. Något som tillsammans med den alternativa evidensen kan förklara bristen på positiv outcome. För det tredje kan teoretiskt sett Helgessons studerade fas 4-RCT, trots Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 dennes ambitioner att i sin studie frångå den återvändsgränd som utgörs av misstagens sociologi, ändå formaliseras ytterliggare för att lösa den observerade subjektiviteten. För det fjärde är den forskningsmiljö som Latour och Wollgar studerat av just den art som Cochrane-formatet uppkom för att ersätta. För det femte behandlar inte Latour och Wollgar i sitt arbete randomisering, något som öppnar för möjligheten att randomisering kan frammana objektiva resultat. För det sjätte finns det något som Latour och Wollgar i kraft av sin pessimism inför vetenskapens förmåga att upptäcka objektiv kunskap, förefaller ha förbisett; nämligen det objektiva värdet av de intersubjektivt observerbara produkterna av vetenskaplig aktivitet. I bakgrundsdelen tog jag upp hur Richard Dawkins invänt mot socialkonstruktionismen genom påståendet att flygplan bygger på vetenskapliga principer och existerar objektivt. Samma argument bör rimligen vara gällande i relation till den intersubjektivt observerbara effekten av införandet av Cochrane-formatet, som teoretiskt kan ha erfarits i anglosaxiska utbildningssystem. Samtidigt förefaller Cochrane-formatet uppbära ett centralt problem kopplat till detta, som är synonymt med det summerande resonemang som Latour och Wollgar fört i sin studie och som de menar är generaliserbart för all vetenskap; d.v.s. att det är svårt att se effekten av formatet på andra sätt än genom formatets egna kriterier för effekt. Intersubjektiva observationer av effekt tappar enligt detta resonemang objektiv legitimitet i och med att dessa observationer sker genom vetenskapsparadigmens egna glasögon. I och med att Cochrane-formatet betraktar kvantifieringar av lågrelevanta RCT-studier som bedrivits på kvantitativa utbildningsmål, som bevis för positiv effekt, så sätter det rimligen upp kriterier för denna effekt som saknar adekvat verklighetsanknytning. Detta varken i förhållande till den heterogena, ickeidealiserade skolkontextens verklighet, eller till de skandinaviska utbildningsmålens verklighet, där kvantifierbar kunskap blott utgör en del av all den kunskap och bildning som skolan är tänkt att förmedla. Detta i kombination med att effekter i skolan tenderar att först kunna utvärderas efter lång tid, förefaller trots allt göra det orimligt att implementera Cochrane-formatets fynd i svensk skola utan att först beakta dess brister och snäva fokus. En strikt riktlinjesmodell blir utifrån detta otänkbar. Ironiskt nog aktualiseras också värdet av kvalitativ metod i och med detta, för att synliggöra de effekter som inte kan synliggöras utifrån Cochrane-formatets egna kriterier för uppmätt effekt. Varken Cochrane-formatets positivism eller socialkonstruktionismens relativism förefaller utifrån ovanstående i sig själva leda fram till konstruktiva evidensdefinitioner. Kvar återstår utifrån tolkningen av litteraturens sammanvägda resultat, således de förslag till hanterande av Cochraneformatet och dess alternativs brist på stringens och relevans som Bergmark, Lundström, Sager, Bohlin och Levinsson föreslår; d.v.s. beaktande av för- och nackdelar med olika evidenstyper. Som ovan nämnts förespråkar Sager, Bohlin och Levinsson Critical appraisal som en metod för detta. Mest tydligt förslag på hur detta ska gå till ger Levinsson. Han ser som ovan nämnts det nybildade skolforskningsinstitutet som en väg framåt och förespråkar att detta bör arbeta för att skapa väl avvägda systematiska översikter som lärare genom en omstrukturerad lärarutbildning har kompetens att kunna återbedöma utifrån stegen i Critical appraisal. Samtidigt har Critical appraisal som metod utifrån Nilsens resonemang ovan visat sig mycket svårbedrivet också i modifierad form, varför det framstår som oklart huruvida Levinssons förslag kan ses som en direkt och enkel lösning på problemet. Sammantaget förefaller debatten om hur utbildningsområdet ska evidensbaseras få fortgå en längre tid innan de balansakter som föreslås, solidifieras nog för att kunna stå emot det ideologiska och paradigmatiska tunnelseende som beskrivits i detta arbetes början, och som kommit att utnyttja balansakternas vaghet för att vinna makt över debatten. Just detta dogmatiska tänkande kring evidensbegreppet är utifrån fynden i detta arbete rimligen det största hindret för etablerandet av den evidensbaserade skolan. Utifrån detta är det enligt min mening orimligt i nuläget att se läraren Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 som någon som tjänstemannamässigt ska implementera specifik evidens som ordineras uppifrån i hierarkin. Hur den evidensbaserade professionalitet som istället bör vara gällande ska kunna formaliseras utifrån Critical appraisal, trots de höga krav som metoden ställer på tid och kompetens, är utifrån fynden i detta arbete, en fråga som är av stor vikt för skapandet av den sant evidensbaserade skolan. Detta bör rimligen föranleda blocköverskridande politiska samarbeten, tvärvetenskapliga samarbeten mellan de vetenskapsparadigm som behandlats i denna uppsats liksom tätare kontakter och vagare gränser mellan lärarprofessionen och de utbildningsvetenskapliga forskarna. På detta sätt kan skolan förhoppningsvis så småningom finna en evidensdefinition som balanserar metodologisk stringens och praktisk relevans genom professionellt oberoende och en politisk och vetenskaplig insikt om orimligheten i dogmatiska synsätt på vilka forskningsmetoder som skolans verklighet kräver. 9. FORTSATT FORSKNING Detta arbete har behandlat skandinaviska perspektiv på Cochrane-formatets ändamålsenlighet, implementerbarhet och trovärdighet liksom önskvärda alternativ till detta. Mer sammanställningar behövs kring hur formatet fungerat i de länder där det varit norm under en längre tid. Detta med fokus på vad som i dessa länder definieras som positiva utfall samt vad som inte anses som relevanta faktorer att mäta eller för den delen utforska kvalitativt. Den fortsatta forskningen bör alltså enligt mina slutsatser kring litteraturen, utgå från den värderingsmässiga skillnaden mellan den anglosaxiska curriculumtradition och den skandinaviska didaktiktraditionen så som denna skillnad beskrivits i bakgrundsdelen i detta arbete. Med utgångspunkt i denna skillnad bör fortsatt forskning bedöma huruvida Cochrane-formatet och annan kvantitativt grundad evidens har objektiva styrkor som kan komplettera den kvalitativa evidens som krävs för beaktandet av de mjuka värden, så som demokratifostrandet, som är centrala för den svenska skolan. I förlängningen är det också nödvändigt att genom forskning försöka utröna i vilken utsträckning vetenskapliga paradigm bär på filosofiska antaganden om människan som mer tangerar ideologiernas sfär än den allmännyttiga objektiviteten. En fråga som aktualiseras av de ideologiska syften som olika former av evidens förefaller vara olika bra på att gynna. Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 10. KÄLLFÖRTECKNING Litteratur Latour, Bruno och Wollgar, Steven. 1986. Laboratory life : the construction of scientific facts. Princeton: Princeton university press Bohlin Ingemar och Sager, Morten (red). 2011. Evidensens många ansikten : evidensbaserad praktik i praktiken. Lund: Arkiv förlag Levinsson, Magnus. 2013. Evidens och existens : evidensbaserad undervisning i ljuset av lärares erfarenheter. Diss., Göteborgs universitet Nilsen, Per (red). 2014. Implementering av evidensbaserad praktik. Malmö: Gleerups förlag Månsson, Per (red). 2007. Moderna samhällsteorier : traditioner, riktningar, teoretiker. Göteborg: Norstedts akademiska förlag Skolverket. 2013a. PISA 2012: 15-åringars kunskaper i matematik, läsförståelse och naturvetenskap. Stockholm: Skolverket Skolverket. 2013b. Forskning för klassrummet: Vetenskaplig grund och beprövad erfarenhet I praktiken. Stockholm: Skolverket Wennström, Johan. 2014. Lärare utan frihet : När vänstern och högern kidnappade lärarprofessionen. Samhällsförlaget Lübcke, Poul (red). 2003. Filosofilexikonet: Filosofer och filosofiska begrepp från A till Ö. Stockholm: Bokförlaget Forum AB Schantz, Richard och Seidel, Markus (red). 2012. The problem of relativism in the sociology of (scientific) knowledge. Ontos verlag. E-bok. M. Hessler, Richard. 1992. Social research methods. St Paul: West publishing company Internetkällor Skollag 2010:800. http://www.riksdagen.se/sv/DokumentLagar/Lagar/Svenskforfattningssamling/Skollag-2010800_sfs-2010-800/?bet=2010:800#K1 (hämtad 2015-03-19). Peter Ivarsson Examensarbete del 1, HT 2014 Ämneslärarprogrammet, Samhällskunskap 2014-12-15 Skolverket. 2014. Evidens, även det en tolkningsfråga?. Skolverket.se. http://www.skolverket.se/skolutveckling/forskning/didaktik/undervisning/evidens-aven-det-entolkningsfraga-1.216407 Tväråna, Malin. 2015a. ”Forska i arbetet bättre än hemsnickrad fortbildning”. DN Debatt. 3 Januari. http://www.dn.se/debatt/forska-i-arbetet-battre-an-hemsnickrad-fortbildning/ (hämtad 2015-0319). Wallberg, Eva och Miljand, Mats. 2015. ”Skolforskningsinstitutet är ett stöd för lärarna”. DN debatt. 5 Januari. http://www.dn.se/debatt/skolforskningsinstitutet-ar-ett-stod-for-lararna/ (hämtad 2015-0319). Alvesson, Mats. 2015. ”Lärarforskning knappast någon lösning”. DN Debatt. 8 Januari. http://www.dn.se/debatt/repliker/lararforskning-knappast-nagon-losning/ (hämtad 2015-03-19). Tväråna, Malin. 2015b. ”Att delta i vetenskapligt underbyggd skolutveckling är inte `amatörforskning´”. DN Debatt. 9 Januari. http://www.dn.se/debatt/repliker/att-delta-ivetenskapligt-underbyggd-skolutveckling-ar-inte-amatorforskning/ (hämtad 2015-03-19). Ingvar, Martin, Sturmark, Christer och Wikforss, Åsa. 2015. ”Den postmoderna sanningsrelativismen leder oss ner i en antiintellektuell avgrund”. DN Debatt. 22 Mars. http://www.dn.se/debatt/denpostmoderna-sanningsrelativismen-leder-oss-ner-i-en-antiintellektuell-avgrund/ (hämtad 2015-0322) Det är lärarnas fel (podcast). 2014. Avsnitt 12: Forskning säger. Soundcloud. https://soundcloud.com/det-ar-lararnas-fel/avsnitt-12-forskning-sager (hämtad 2015-03-17). Levi, Ragnar (red). 2004. Statens beredning för medicinsk utvärderings ordlista http://www.sbu.se/sv/var_metod/Ordlista/Post.aspx?epslanguage=SV%2cSV Nilholm, Claes. 2013. ”Det är dags att kritiskt granska John Hattie”. Pedagogiska magasinet. 21 November. http://www.lararnasnyheter.se/pedagogiska-magasinet/2013/11/21/ar-dags-kritisktgranska-john-hattie Andra källor Riksdagsdebatt 15/1-2015. Svt Forum. Replikskifte mellan Gustav Fridolin och Jan Björklund (TVProgram). Stockholm: Svt.