En bioinformatisk genjakt Efter en ide från: CUSMOBIO, Milano, Italien. Hur man kan söka i databaser efter information om en gen som kan ge ökad risk för bröstcacer. Bakgrund Människor utan symptom men med en känd genetisk sjukdom i familjen kan få möjlighet att testa sig genetiskt för att se om de bär på anlaget för en genetisk sjukdom. I scenariot vi tänker oss här är det en kvinna med många fall av cancer i familjen som vill veta om hon löper större risk än normalt att utveckla en tumörsjukdom. Anna, 23 år, går till en gynekolog. När läkaren frågar henne om sjukdomar i familjen så lägger han märke till att flera kvinnliga medlemmar av släkten har haft cancer. Henes farmor dog vid 40 års ålder av bröstcancer och två fastrar dog i 50-årsåldern av livmodercancer. En tredje faster har precis vid 39 års ålder blivit diagnosticerad med bröstcancer. Gynekologen informerar om att det kan vara möjligt att det i familjen finns någon mutation i en av de två bröstcancergener som man har identifierat (BRCA1 or BRCA2). Under besöket hittar gynekologen också en misstänkt knöl i hennes högra bröst och gör en bioposi på den (tar ett vävnadsprov) för att se om det är en tumör. Gynekologen föreslår att Anna också skulle kunna göra ett DNA test, men informerar att det inte är meningsfullt att göra det om man inte vet huruvida det finns en muterad gen i familjen eller inte. Det visar sig att fastern med bröstcancer redan har testats positiv för en ganska ovanlig mutation i BRCA2-genen. Så gynekologen använder en del av provet från biopsin för att testa för en mutation i just den genen. När man diagnosticerar genetiska sjukdomar använder man ofta en teknik som heter Reverse Transcription Polymerase Chain Reaction (RT-PCR). RT-PCR är en teknik som gör det möjligt att kopiera upp en del av en mRNA molekyl. Reverse betyder omvänd och det står för att det första man gör är att omvandla en RNA-sträng till DNA som man sedan multiplicerar genom en vanlig PCR-reaktion. PCR är en metod med vilken man kan kopiera upp stora mängder av ett visst DNAavsnitt och som också möjliggör att man i nästa steg kan ta reda på kvävebassekvensen för detta DNA. Fördelen är att RT-PCR använder mRNA som mönster, vilket innebär att man kan studera den gen som verkligen uttrycks som ett protein i just den vävnad som man studerar, i det här fallet bröstet. En vanlig DNA undersökning är inte lika specifik. På Annas prov gör man nu en RTR-PCR som fångar in samma gen som hennes faster hade en mutation i och PCR-produkten man får sekvenseras för att ta reda på ordningen på kvävebaserna i DNA-sekvensen. Den sekvensen skall du nu använda för att identifiera mutationen som finns i Annas familj och för att se om den är närvarande i hennes prov. Mål 1: Identifiera vilken gen DNA-sekvensen tilhör och på vilken kromosom den sitter. Mål 2: Titta på hur proteinet som genen kodar för ser ut Mål 3: Ta fram information om den genen 1 Mål 1: Identifiera vilken gen Annas sekvens kommer från och se om den är muterad eller inte Sekvensen som kommer från sekvenseringen ser ut som följer: TGCACTAACAAGACAGCAAGTTCGTGCTTTGCAAGATGGTGCAGAGCTTTATGAAGCAGTGAAGAATGCA GCAGACCCAGCTTACCTTGAGTTATACTGAGTATTTGGCGTCCATCATCAGATTTATATTCTCTGTTAACAGA AGGAAAGAGATACAGAATTTATCATCTTGCAACTTCAAAATCTAAAAGTAAATCTGAAAGAGCTAACATAC AGTTAGCAGCGACAAAAAAAACTAGTATCAACAACTACCGGTTTCAGATGAAATTTTATTTCAGATTTACCA GCCACGGGAGCCCTTCACTTCAGCAAATTTTTAGATCCAGACTTTCAGCCATCTTGTTCTGA Du börjar med att använda BLAT (BLAST-Like Alignment Tool) som är en metod för att jämföra DNA-sekvenser. När du skickar in en sekvens till BLAT så jämför programmet din insända sekvens med alla andra som finns i databasen och ger dig sedan en lista över de sekvenser som är mest lik den du skickat in. Gå till sidan: http://genome.ucsc.edu/ cgi-bin/hgBlat?db=mm2 Kopiera och klistra in sekvensen ovan i det vita fältet och tryck på “submit”. (Om du inte vet eller kommer på hur man kan väja och kopiera text i Acrobat reader kan du hämta sekvensen på min hemsida På adressen http://perkornhall.se/Skolan/KeB/ annas_sekvens.rtf) BLAT-resultatfönstret kommer att visa flera olika träffar i en lista. Du väljer den första, den som har störst antal träffar (score). Det fins också en del information här som att din sekvens var 350 baser lång och att den matchar en sekvens på kromosom 13. Sedan klickar du på “browser” för att få information om den kromosomala region som din sekvens befinner sig på. 2 På den bild som då dyker upp kan du se var på kromosomen din gen befinner sig. Den är rödmarkerad på översikten över kromosomen. Översikt över kromosomen Inskickade sekvensen Bästa träffen Jämförelse med samma sekvens från andra djur I fältet nedanför bilden på kromosomen ser du din sekvens och under den en alignment, en jämförelse mellan den sekvens du skickade in, med den bästa träff som fanns i databasen. För att förstå den här bilden är det viktigt att du kommer ihåg att gener bara är en liten del av arvsmassan. Man försöker fortfarande förstå vad resten egentligen är. Generna ligger utspridda bland långa strckor ickekodande DNA och en gen är oftast delad i olika delar, exoner, och emellan dem finns bitar av ickekodande DNA, introner. I figuren kan man se de alignade delarna som block (svarta eller röda) medan regioner utan DNA är en tunn linje. Eftersom det DNA som kom från Annas prov var från mRNA så innehåller det bara exoner, bara uttryckt material. Som väntat är den gen som är närmast söksekvensen en känd bröstcancergen. Om man klickar på namnet för den kan man få information om den genen, vilket du skall göra i nästa steg. Men först: hur många exoner (svarta block) har BRCA2 i sökfönstret? Hur många har Annas sekvens? Kan du utifrån det dra någon slutsats om var mutationen i Annas och hennes fasters gen finns någonstans? 3 Mål 2: Ta reda på mer om BRCA2 1. Klicka på BRCA2 och läs om den. Hur tror man att BRCA2 fungerar? 2. Tryck på Treefam i den andra tabellen nedanför beskrivningen (under rubriken Sequence and Links to Tools and Databases). Nu kommer det upp en sida som bland annat innehåller en bild på ett släktskapsträd. Där har man räknat ut hur den mänskliga genen förhåller sig till samma gen hos andra djur. Om du pekar på BRAC2:s närmaste släkting så dyker det upp ett namn Pan troglodytes. Vad tror du att det är för djur? 3. Gå sedan till http://www.genome.gov/10000940 Den studie som beskrivs där handlade om en speciell folkgrupp. Hur kan det komma sig att man vill undersöka speciella folkgrupper på det här viset? 2. 4 Mål 2: Titta på BRAC2:s molekylära struktur Redan nu har du sett att molekylärbiologerna har en massa kraftfulla instrument på nätet som de kan använda sig av. Instrument som ligger öppna så att vem som helst som har intresse och kunskap kan använda sig av dem. Nu skall vi titta på en annan aspekt av detta. Många proteiner vet man inte bara hur de fungerar utan man har också bestämt genom röntgenkristallografi hur de ser ut. Den informationen finns också öppet på internet. Nu skall vi se om det finns någon struktur bestämd för BRCA2. Gå först till den stora databasen för proteiner Swissprot http://www.expasy.org/sprot/ Skriv in BRCA2 human i sökrutan och tryck på Go. Sök upp BRCA2_HUMAN på den nya sidan som dyker upp och klicka på den länken. Nu dyker det upp ännu en sida. För att kuna se om det finns någon tredimensionell struktur så får vi leta oss ner på sidan till rubriken 3D structure databases (ganska långt ner på sidan). Under den rubriken tittar vi på raden som börjar med PDB och väljer länken längst till höger som ser ut så här: [>>]. Du hamnar nu på en sida med två bilder på proteinet. 1. Vad betyder de konstiga spiralerna och grejorna? 2. Vad kan man ha för nytta av att veta hur ett protein ser ut i 3D? Om du gör det här hemma kan du ladda hem programmet Rasmol och sedan när du installerat det titta på filen (som finns under view). Då kan du rotera molekylen som du vill och zooma obehindrat mm. Jag hoppas att detta har gett dig en förståelse av vilket stort forskningsområde molekylärbiologi är och vilka avancerade instrument som finns till hands för alla som har en dator med internet. 5