En bioinformatisk genjakt
Efter en ide från: CUSMOBIO, Milano, Italien.
Hur man kan söka i databaser efter information om en gen som kan ge ökad risk för
bröstcacer.
Bakgrund
Människor utan symptom men med en känd genetisk sjukdom i familjen kan få möjlighet att testa
sig genetiskt för att se om de bär på anlaget för en genetisk sjukdom. I scenariot vi tänker oss här är
det en kvinna med många fall av cancer i familjen som vill veta om hon löper större risk än normalt
att utveckla en tumörsjukdom.
Anna, 23 år, går till en gynekolog. När läkaren frågar henne om sjukdomar i familjen så lägger han
märke till att flera kvinnliga medlemmar av släkten har haft cancer. Henes farmor dog vid 40 års
ålder av bröstcancer och två fastrar dog i 50-årsåldern av livmodercancer. En tredje faster har precis
vid 39 års ålder blivit diagnosticerad med bröstcancer. Gynekologen informerar om att det kan vara
möjligt att det i familjen finns någon mutation i en av de två bröstcancergener som man har
identifierat (BRCA1 or BRCA2). Under besöket hittar gynekologen också en misstänkt knöl i
hennes högra bröst och gör en bioposi på den (tar ett vävnadsprov) för att se om det är en tumör.
Gynekologen föreslår att Anna också skulle kunna göra ett DNA test, men informerar att det inte är
meningsfullt att göra det om man inte vet huruvida det finns en muterad gen i familjen eller inte.
Det visar sig att fastern med bröstcancer redan har testats positiv för en ganska ovanlig mutation i
BRCA2-genen. Så gynekologen använder en del av provet från biopsin för att testa för en mutation
i just den genen.
När man diagnosticerar genetiska sjukdomar använder man ofta en teknik som heter Reverse
Transcription Polymerase Chain Reaction (RT-PCR). RT-PCR är en teknik som gör det möjligt att
kopiera upp en del av en mRNA molekyl. Reverse betyder omvänd och det står för att det första
man gör är att omvandla en RNA-sträng till DNA som man sedan multiplicerar genom en vanlig
PCR-reaktion. PCR är en metod med vilken man kan kopiera upp stora mängder av ett visst DNAavsnitt och som också möjliggör att man i nästa steg kan ta reda på kvävebassekvensen för detta
DNA. Fördelen är att RT-PCR använder mRNA som mönster, vilket innebär att man kan studera
den gen som verkligen uttrycks som ett protein i just den vävnad som man studerar, i det här fallet
bröstet. En vanlig DNA undersökning är inte lika specifik.
På Annas prov gör man nu en RTR-PCR som fångar in samma gen som hennes faster hade en
mutation i och PCR-produkten man får sekvenseras för att ta reda på ordningen på kvävebaserna i
DNA-sekvensen. Den sekvensen skall du nu använda för att identifiera mutationen som finns i
Annas familj och för att se om den är närvarande i hennes prov.
Mål 1: Identifiera vilken gen DNA-sekvensen tilhör och på vilken kromosom den sitter.
Mål 2: Titta på hur proteinet som genen kodar för ser ut
Mål 3: Ta fram information om den genen
1
Mål 1: Identifiera vilken gen Annas sekvens kommer från och se om den är muterad
eller inte
Sekvensen som kommer från sekvenseringen ser ut som följer:
TGCACTAACAAGACAGCAAGTTCGTGCTTTGCAAGATGGTGCAGAGCTTTATGAAGCAGTGAAGAATGCA
GCAGACCCAGCTTACCTTGAGTTATACTGAGTATTTGGCGTCCATCATCAGATTTATATTCTCTGTTAACAGA
AGGAAAGAGATACAGAATTTATCATCTTGCAACTTCAAAATCTAAAAGTAAATCTGAAAGAGCTAACATAC
AGTTAGCAGCGACAAAAAAAACTAGTATCAACAACTACCGGTTTCAGATGAAATTTTATTTCAGATTTACCA
GCCACGGGAGCCCTTCACTTCAGCAAATTTTTAGATCCAGACTTTCAGCCATCTTGTTCTGA
Du börjar med att använda BLAT (BLAST-Like
Alignment Tool) som är en metod för att jämföra
DNA-sekvenser. När du skickar in en sekvens till
BLAT så jämför programmet din insända sekvens
med alla andra som finns i databasen och ger dig
sedan en lista över de sekvenser som är mest lik den
du skickat in. Gå till sidan: http://genome.ucsc.edu/
cgi-bin/hgBlat?db=mm2
Kopiera och klistra in sekvensen ovan i det vita fältet
och tryck på “submit”. (Om du inte vet eller kommer
på hur man kan väja och kopiera text i Acrobat reader
kan du hämta sekvensen på min hemsida På adressen http://perkornhall.se/Skolan/KeB/
annas_sekvens.rtf)
BLAT-resultatfönstret kommer att visa flera olika träffar i en lista. Du väljer den första, den som har
störst antal träffar (score). Det fins också en del information här som att din sekvens var 350 baser
lång och att den matchar en sekvens på kromosom 13.
Sedan klickar du på “browser” för att få information om den kromosomala region som din sekvens
befinner sig på.
2
På den bild som då dyker upp kan du se var på kromosomen din gen befinner sig. Den är
rödmarkerad på översikten över kromosomen.
Översikt över kromosomen
Inskickade sekvensen
Bästa träffen
Jämförelse med samma
sekvens från andra djur
I fältet nedanför bilden på kromosomen ser du din sekvens och under den en alignment, en
jämförelse mellan den sekvens du skickade in, med den bästa träff som fanns i databasen.
För att förstå den här bilden är det viktigt att du kommer ihåg att gener bara är en liten del av
arvsmassan. Man försöker fortfarande förstå vad resten egentligen är. Generna ligger utspridda
bland långa strckor ickekodande DNA och en gen är oftast delad i olika delar, exoner, och emellan
dem finns bitar av ickekodande DNA, introner.
I figuren kan man se de alignade delarna som block (svarta eller röda) medan regioner utan DNA är
en tunn linje. Eftersom det DNA som kom från Annas prov var från mRNA så innehåller det bara
exoner, bara uttryckt material.
Som väntat är den gen som är närmast söksekvensen en känd bröstcancergen. Om man klickar på
namnet för den kan man få information om den genen, vilket du skall göra i nästa steg. Men först:
hur många exoner (svarta block) har BRCA2 i sökfönstret? Hur många har Annas sekvens? Kan du
utifrån det dra någon slutsats om var mutationen i Annas och hennes fasters gen finns någonstans?
3
Mål 2: Ta reda på mer om BRCA2
1. Klicka på BRCA2 och läs om den.
Hur tror man att BRCA2 fungerar?
2. Tryck på Treefam i den andra tabellen nedanför beskrivningen (under rubriken Sequence and
Links to Tools and Databases).
Nu kommer det upp en sida som bland annat innehåller en bild på ett släktskapsträd. Där har man
räknat ut hur den mänskliga genen förhåller sig till samma gen hos andra djur. Om du pekar på
BRAC2:s närmaste släkting så dyker det upp ett namn Pan troglodytes. Vad tror du att det är för
djur?
3. Gå sedan till http://www.genome.gov/10000940
Den studie som beskrivs där handlade om en speciell folkgrupp. Hur kan det komma sig att man
vill undersöka speciella folkgrupper på det här viset?
2.
4
Mål 2: Titta på BRAC2:s molekylära struktur
Redan nu har du sett att molekylärbiologerna har en massa kraftfulla instrument på nätet som de kan
använda sig av. Instrument som ligger öppna så att vem som helst som har intresse och kunskap kan
använda sig av dem. Nu skall vi titta på en annan aspekt av detta.
Många proteiner vet man inte bara hur de fungerar utan man har också bestämt genom
röntgenkristallografi hur de ser ut. Den informationen finns också öppet på internet. Nu skall vi se
om det finns någon struktur bestämd för BRCA2.
Gå först till den stora databasen för proteiner Swissprot http://www.expasy.org/sprot/
Skriv in BRCA2 human i sökrutan och tryck på Go.
Sök upp BRCA2_HUMAN på den nya sidan som dyker upp och klicka på den länken.
Nu dyker det upp ännu en sida. För att kuna se om det finns någon tredimensionell struktur så får vi leta oss
ner på sidan till rubriken 3D structure databases (ganska långt ner på sidan). Under den rubriken tittar vi på
raden som börjar med PDB och väljer länken längst till höger som ser ut så här: [>>].
Du hamnar nu på en sida med två bilder på proteinet.
1. Vad betyder de konstiga spiralerna och grejorna?
2. Vad kan man ha för nytta av att veta hur ett protein ser ut i 3D?
Om du gör det här hemma kan du ladda hem programmet Rasmol och sedan när du installerat det
titta på filen (som finns under view). Då kan du rotera molekylen som du vill och zooma obehindrat
mm.
Jag hoppas att detta har gett dig en förståelse av vilket stort forskningsområde
molekylärbiologi är och vilka avancerade instrument som finns till hands för alla som har en
dator med internet.
5