NGS-baserad diagnostik av lungcancer vid Centrum för Molekylär Diagnostik 2015-02-11 Centrum för molekylär diagnostik (CMD) inrättades i oktober 2014 i syfte att stärka klinisk diagnostik baserat på den s.k. nya generationens sekvenseringsteknik (NGS) inom Region Skåne. CMD tillhör organisatoriskt Medicinsk service-förvaltningen. Vid CMD samverkar verksamhetsområden inom Medicinsk service/Labmedicin, Skånes Universitetssjukhus (SUS) och forskargrupper vid Lunds Universitet (LU). Inom CMD utarbetas korta översikter för NGS-baserad diagnostik vid olika sjukdomstillstånd. Dessa översikter författas av arbetsgrupper för olika diagnoser med en representant från CMD som sammankallande och dokumentansvarig. Aktuell översikt berör NGS-baserad diagnostik av lungcancer. Arbetsgruppen består av följande personer: • • • • • • • • • • Johan Staaf, Docent, Avd. för Onkologi och Patologi, LU (sammankallande och dokumentansvarig) Per Leveén, processledare molekylärpatologi, Klinisk Patologi, Labmedicin Kajsa Ericson-Lindquist, medicinsk ansvarig molekylärpatologi, Klinisk Patologi, Labmedicin Hans Brunnström, processledare lungpatologi, Klinisk Patologi, Labmedicin Göran Jönsson, Docent, Avd. för Onkologi och Patologi, LU Per Jönsson, överläkare, Thoraxkirurgi, SUS Håkan Griph, överläkare, Lungmedicin, SUS Ronny Öhman, överläkare, Lungmedicin, SUS Lars Ek, överläkare, Lungmedicin, SUS Maria Planck, specialist, Onkologiska kliniken, SUS Bakgrund Lungcancer är den femte vanligaste cancerformen i Sverige, med cirka 3500 nya fall per år. Dödligheten är hög, med en total 5-års-överlevnad på ca 14% för män och 19% för kvinnor. Lungcancer utgör därför den vanligaste cancerrelaterade dödsorsaken (www.socialstyrelsen.se). Den främsta orsaken till den dåliga prognosen är att sjukdomen oftast (i ca 75% av fallen) diagnostiseras i icke-operabelt stadium. På molekylär nivå är lungcancer en mycket heterogen sjukdom med flera histologiska undergrupper. Traditionellt görs en första uppdelning i småcellig cancer (SCLC) och icke-småcellig lungcancer (NSCLC, ca 80-85% av alla patienter). Den senare gruppen består i sin tur av flera undergrupper, varav de största är adenocarcinom, skivepitelcancer och storcellig lungcancer. De olika undergrupperna uppvisar stora skillnader avseende prognos, association med rökning, morfologi, proteinuttryck, genuttryck och DNA-förändringar. Kartläggning av somatiska DNA-förändringar i lungcancergenom har identifierat EGFR och KRAS som de två mest muterade onkogenerna i NSCLC. Mutationer i EGFR och KRAS återfinns främst i adenocarcinom, vilken idag representerar den största undergruppen av NSCLC. EGFR och KRAS kodar för protein som är viktiga element i signalvägar i cellen som ofta är aktiverade i cancer. Specifika mutationer i dessa gener skapar ett aktiverat protein vilket i sin tur aktiverar specifika signalvägar och stimulerar tumörtillväxt. Patienter med aktiverande KRASmutationer behandlas idag ej rutinmässigt med målstyrd terapi, medan det för patienter vars tumör uppvisar EGFR-mutation, finns flera olika EGFR-hämmande läkemedel i kliniskt bruk. Aktiverande mutationer i EGFR finns främst i exon 18-21 i EGFR genen och observeras i ca 10-30% av patienter med NSCLC (1). Ett stort antal kliniska studier har idag bevisat att patienter med avancerad sjukdom och aktiverande EGFR-mutation uppvisar signifikant ökad sjukdomsfri överlevnad om de behandlas med en EGFR-inhibitor i jämförelse med standardvalet av cytostatika (2). Trots att patienter med EGFR-muterade tumörer i de flesta fall svarar mycket väl på behandling uppkommer obligatoriskt en behandlingsresistens, och ofta ses detta redan efter kort tid (3). Bakgrunden till behandlingsresistensen är mångfacetterad och innefattar dels sekundära förändringar i EGFR (ex uppkomst av resistensmutationen T790M), men även mutationer eller DNA kopietalsförändringar i andra onkgener/tumörsuppressor gener har visats ge upphov till resistens mot EGFR-inhibitorer (3). Förutom EGFR existerar andra behandlingsrelevanta genförändringar i lungcancer, ex mutationer i BRAF, HER2, PIK3CA, AKT1, MAP2K1 och MET, samt ALK och ROS1 genfusioner (1). Det gemensamma för dessa förändringar är att de, i en oselekterad patientpopulation, förekommer i låg frekvens. Därmed föreligger det ett reellt kliniskt behov av att prediktivt testa lungcancertumörer för mutationer både primärt i EGFR och, i förlängningen, andra, ovanligare, mutationer/förändringar i andra gener. Detta är av vikt både för val av framtida målstyrda terapier och för hantering av behandlingsresistens. Generellt testas idag lungcancerpatienter kliniskt för mutationer i EGFR med metoder som ger information för en gen i taget. Med ett växande antal mutationer och gener som kan ha betydelse för dels behandlingssvar med befintliga riktade terapier men även för nya terapier under pågående prövning i kliniska studier börjar denna strategi bli tids- och kostnadsmässigt ohållbar. Därför behövs ett nytt synsätt med nya känsliga metoder, där många cancerrelevanta gener analyseras samtidigt för varje patient. Dylika metoder möjliggör identifiering av inte bara de mest vanligt förekommande förändringarna, utan också av förändringar som är lågfrekventa i den allmänna patientpopulationen och av lågfrekventa förändringar av hittills okänd betydelse som kan förekomma i tillägg till redan kända förändringar i en och samma tumör (multiklonalitet). Inom Region Skåne utfördes ca 350 EGFR mutationsanalyser för lungcancer under 2014. De patienter som hittills varit aktuella för mutationsanalys och som erbjuds behandling utifrån analysresultatet är patienter med avancerad icke-skivepitel NSCLC, samt recidiv från kirurgiskt behandlade sådana patienter. Fr.o.m. januari 2015 införs dock successivt, med start på Skånes Universitetssjukhus, SUS, reflextestning av alla NSCLC, oavsett stadium och undergrupp. Provtagningsrutiner och provhantering för NGS-baserad diagnostik Utgångspunkten för den NGS-baserade diagnostiken är paraffininbäddad formalinfixerad vävnad (s.k. FFPE vävnad). Molekylärpatolog ansvarar för materialets lämplighet för analys, genom att granska tumörvävnad från de histologiska och/eller cytologiska preparat som finns arkiverade. Ett representativt tumörområde väljs ut med hög andel maligna cellkärnor. Ofta kan detta utgöra en liten del av den vävnadsbit som finns i en FFPE klots. Ett antal tunna snitt av urvald tumörvävnad tas, typiskt 4st 5um snitt, samt nya HTX-snitt för att verifiera att representativt material analyserats. (utförs av VO Klinisk Patologi). Vid tillfälle kan provpreparatet även bestå av cytologimaterial i form av cytologiutstryk, där ett cellysat förbereds varifrån DNA extraheras, eller paraffininbäddat centrifugerat cytologimaterial som snittas (s.k. cellblock). Provet, tillsammans med mutationsremiss, transporteras därefter till Avdelningen för Onkologi och Patologi. Provtransport sker två gånger i veckan på bestämda dagar (se Figur 1). Vid ankomst av prov och remiss till avdelningen registreras provet och remissen arkiveras i ett dedikerat remissrum (se Figur 1). Vid registrering erhåller varje prov ett avkodat löpnummer specifikt för laboratoriet. Detta löpnummer används därefter i den laborativa såväl som dataanalysdelen av mutationsanalysen. Kopplingen mellan löpnummer och persondata är endast tillgänglig för dedikerad personal från Avdelningen för Onkologi och Patologi och VO Klinisk Patologi via Region Skånes ITstruktur, inom vilken även färdigställande av mutationsrapport sker. Figur 1. Översikt av NGS-baserad diagnostik vid Avdelningen för Onkologi och Patologi. Varje vecka utförs två stycken parallella analyser med olika startdagar. En analys tar 5 arbetsdagar i anspråk från det att DNA/RNA extraktion påbörjats till dess att mutationssvar rapporteras tillbaka. Nukleinsyra extraktion och DNA kvalitetskontroll Från provet (FFPE snitt) extraheras DNA och RNA. Först avparaffiniseras provet med hjälp av lösningsmedel (xylen), varefter den rena tumörvävnaden bryts ner enzymatiskt så att DNA och RNA frisläpps i lösning. DNA/RNA isolering sker därefter automatiserat med ett kommersiellt extraktionskit (Qiagen FFPE AllPrepp). DNA/RNA extraktion utförs två gånger i veckan (se Figur 1). Formalinfixering av tumörvävnad leder till degradering av nukleinsyror. Det är därför av stor betydelse att uppskatta hur utbredd DNA degraderingen är innan molekylärgenetisk analys genomförs. Extraherat DNA används i en kvantitativ PCR reaktion för att bestämma hur stor mängd av det totala DNAt som motsvarar en viss storlek. Detta är ett viktigt steg för att kunna förutspå vilka prover som kommer att ge ett tillförlitligt mutationssvar. Den kvantitativa PCR analysen resulterar i ett kvalitetsvärde som indikerar provets lämplighet för NGS-baserad diagnostik. Om kvalitetsvärdet faller utanför empiriskt definierade ramar återrapporteras detta till Klinisk Patologi där ett beslut tas om preparatet trots allt ska gå vidare till mutationsanalys eller om nytt material ska begäras. Detta förfarande förkortar avsevärt svarstiden för prov som sannolikt inte skulle ge informativa svar i NGSanalysen. NGS-baserad diagnostik för identifiering av somatiska mutationer Prov vars DNA passerat kvalitetskontrollen går vidare till den NGS-baserade mutationsanalysen. Metoden som används vid Avdelningen för Onkologi och Patologi är baserad på Illuminas (www.illumina.com) ”next generation sequencing” (NGS) teknik i kombination med en riktad genpanel (Illumina TruSight Tumor genpanel). Den riktade genpanelen innefattar 26 stycken utvalda cancerrelaterade gener (Figur 2 och Tabell 1). Figur 2. Gruppering av TruSight Tumor 26-gen NGS panel enligt tumörsjukdom (www.illumina.com). GIST: Gastrointestinal stromacellstumör. För dessa gener analyseras olika antal hela kodande exon. Val av exon är baserat på förekomst av rapporterade somatiska tumörförändringar via exempelvis COSMIC (http://cancer.sanger.ac.uk), CAP (www.cap.org) och NCCN (www.nccn.org) riktlinjer, samt kliniska prövningar (www.clinicaltrials.gov). Den experimentella delen av NGS metoden kan delas upp i två steg, i) preparering av ett s.k. DNA provbibliotek för varje prov och ii) själva sekvenseringen. Ett DNA provbibliotek betyder här en vätskelösning av ett stort antal olika DNA fragment för vilka DNA sekvensen ska bestämmas. I prepareringen av ett provbibliotek för ett specifikt prov anrikas först DNA från de specifika genregioner som ska analyseras via en hybridiseringsprocess. Denna anrikning utförs separat för de två olika DNA strängarna via olika oligonukleotidpooler. Detta innebär att för varje prov skapas i slutändan två individuella provbibliotek vilka är att betrakta som tekniska replikat. Därefter amplifieras de utvalda genregioner i en PCR reaktion, och specifika oligonukleotidadaptorer kopplas på varje fragment för att möjliggöra sekvensering. Innan sekvensering poolas de två biblioteken för varje prov. På grund av NGS teknikens massiva kapacitet kan många prov prepareras parallellt, poolas, och sekvenseras samtidigt, vilket medger ett högt provflöde. Sekvenseringen sker därefter på ett Illumina MiSeq instrumentet. Den experimentella mutationsanalysen (bibliotekspreparation och sekvensering) utförs två gånger per vecka (se Figur 1). Tabell 1. Gener och hela exon ingåendes i Illumina TruSight Tumor genpanelen. Gen Typ av gen Analyserade hela exon AKT1 Onkogen 2 ALK Onkogen 23 APC Tumörsuppressor gen 15 BRAF Onkogen 11, 15 CDH1 Tumörsuppressor gen 8, 9, 12 CTNNB1 Onkogen 2 EGFR Onkogen 18, 19, 20, 21 ERBB2 Onkogen 20 FBXW7 Tumörsuppressor gen 7, 8, 9, 10, 11 FGFR2 Onkogen 6 FOXL2 Onkogen 1 GNAQ Onkogen 4, 5, 6 GNAS Onkogen 6, 8 KIT Onkogen 9, 11, 13, 17, 18 KRAS Onkogen 1, 2, 3, 4 MAP2K1 Onkogen 2 MET Onkogen 1, 4, 13, 15, 16, 17, 18, 20 MSH6 Tumörsuppressor gen 5 NRAS Onkogen 1, 2, 3, 4 PDGFRA Onkogen 11, 13, 17 PIK3CA Onkogen 1, 2, 7, 9, 20 PTEN Tumörsuppressor gen 1, 2, 3, 4, 5, 6, 7, 9 SMAD4 Tumörsuppressor gen 8, 11 SRC Onkogen 10 STK11 Tumörsuppressor gen 1, 4, 6, 8 TP53 Tumörsuppressor gen 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 Analys av somatiska varianter från NGS data NGS tekniken genererar en massiv sekvensmängd för varje prov. För att kunna identifiera somatiska mutationer (varianter) i denna stora datamängd för de 26 generna sker ett antal dataanalyssteg i samband med sekvensering (Figur 1). Först måste sekvensdatan från MiSeq instrumentet matchas mot ett humant referensgenom för att definiera vilka sekvenser som hör till en viss undersökt genregion, ex exon 19 i EGFR. För Illumina TruSight Tumor panelen sker detta via en BWA baserad alignment algoritm (4). Därefter identifieras basparspositioner där den undersökta sekvensen inte matchar referensgenomet, s.k. varianter (potentiella mutationer). Denna analys sker via en implementering av en GATK baserad algoritm (5). Genom att räkna antalet sekvenser med en viss variant jämfört med totala antalet sekvenser för området kan en variantfrekvens beräknas (Figur 3). Figur 3. Illustration över begreppet variantfrekvens. A) NGS-analys har identifierat en deletion av 15 baser i exon 19 i EGFR genen i ett lungcancer adenocarcinom. X-axeln visar basparspositioner i genomet för exon 19 i EGFR genen. Y-axeln visar antalet gånger respektive bas har sekvenserats, s.k. täckningsgrad. Deletionen visar sig som en tydlig nedgång i täckningsgrad eftersom de 15 baserna är deleterade i många tumörcellers genom. B) NGS-analys har identifierat en punktmutation i exon 6 i tumörsuppressorgenen TP53 i ett lungcancer adenocarcinom. X-axeln visar ett begränsat antal baser (en cirkel motsvarar en bas) i exon 6 i TP53 genen. Y-axeln visar täckningsgrad enligt A. Röd linje visar antalet gånger en bas med avvikande sekvens mot referensgenomet (grön linje) har identifierats. Punktmutationen ses som en höjning av den röda linjen över noll för en specifik bas i exon 6, motsvarande 25% av alla sekvenser för denna bas. Variantfrekvensen ger en indirekt uppfattning av hur frekvent mutationen är i tumören. En variant (mutation) som detekteras endast i ett fåtal sekvenser kan reflektera att endast en subklon av tumören bär på mutationen, alternativt att det analyserade preparatets tumörhalt är låg. I denna analys utnyttjas det faktum att varje prov representeras av två olika provbibliotek. Endast varianter som korrekt återfinns i båda provbiblioteken används för vidare analys. Detta tillvägagångssätt har fördelen av att kunna identifiera och filtrera bort basparsvariationer som tillkommit genom exempelvis formalinfixeringen av vävnaden (DNA skada). Alla dessa steg är inbyggda i ett strömlinjeformat analysflöde som utförs automatiskt på MiSeq instrumentet under och efter att den faktiska sekvenseringen är klar. Resultatet av analysen består av en textfil med alla identifierade varianter för respektive prov. För annotering och klassificering av varianter för den slutliga mutationsrapporten används ett specifikt annoteringsprogram, VariantStudio, (Illumina). Detta program möjliggör på enkelt sätt annotering av identifierade varianter mot ett stort antal olika databaser, inklusive COSMIC (http://cancer.sanger.ac.uk), ClinVar (www.ncbi.nlm.nih.gov/clinvar), och databaser över naturligt förekommande varianter i det humana genomet (SNP databaser). Kopplat till variantannoteringen sker även klassning och filtrering av identifierade varianter. I detta steg identifieras dels kända behandlingsprediktiva mutationer som exempelvis BRAF V600E, EGFR L858R, och KRAS G12C, men även somatiska varianter som kan vara drivande i tumörutvecklingen men för vilka ingen behandling existerar i nuläget. Återrapportering av mutationsresultat till VO Klinisk Patologi Efter att identifierade varianter från sekvenseringen har annoterats, filtrerats, och klassats sammanställs en rapport över samtliga kvarvarande varianter (mutationer). Först i denna rapport sker återkopplingen mellan patient och mutationssvar. Mutationsrapporten färdigställs inom Region Skånes IT-struktur, varefter rapport samt grunddata över identifierade varianter överförs till VO Klinisk Patologi för vidare sammanställning/formatering och slutgiltig återrapportering till remitterande kliniker. Svarstider NGS-baserad diagnostik Arbetsschemat för NGS-baserad diagnostik inom Avdelningen för Onkologi och Patologi (Figur 1) innebär att två analyser utförs per vecka på bestämda dagar, där varje labanalys tar 5 arbetsdagar i anspråk efter att FFPE tumörvävnad ankommit till avdelningen. Svarstid till VO Klinisk Patologi blir därigenom 5-7 arbetsdagar beroende på när FFPE tumörvävnad är redo för transport från Klinisk Patologi efter snitting. Referenser 1. Pao W, Girard N. New driver mutations in non-small-cell lung cancer. Lancet Oncol 2011;12: 175-80. 2. Ohashi K, Maruvka YE, Michor F, Pao W. Epidermal growth factor receptor tyrosine kinase inhibitor-resistant disease. J Clin Oncol 2013;31: 1070-80. 3. Pao W, Chmielecki J. Rational, biologically based treatment of EGFR-mutant non-small-cell lung cancer. Nat Rev Cancer 2010;10: 760-74. 4. Li H, Durbin R. Fast and accurate short read alignment with BurrowsWheeler transform. Bioinformatics 2009;25: 1754-60. 5. DePristo MA, Banks E, Poplin R, Garimella KV, Maguire JR, Hartl C, et al. A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat Genet 2011;43: 491-8.