Genomik på internet Bakgrund Genetisk och genomisk forskning genererar stora mängder data. Mycket av detta finns tillgängligt i offentliga databaser tillsammans med stora mängder data från annan biologisk forskning. Med den här labben hoppas jag att du ska få en liten introduktion till en del av den genetiska information man kan hitta på nätet. BLAST NCBI (National Center for Biotechnology Information) http://www.ncbi.nlm.nih.gov/ är en amerikansk portal som startades 1988 som en nationell (amerikansk) resurs för molekylärbiologisk information. Det är ett utmärkt ställe att börja söka information på. Här kan man bland annat använda sig av BLAST (Basic Local Alignment Search Tool), ett verktyg för att jämföra en DNA-sekvens med de som finns lagrade i den stora databasen GenBank. Klicka dig fram till sidan för BLAST och välj ”nucleotide blast”. Följande sekvens finns att hämta på kurshemsidan: aaagaagtga ctggagttca cagtatggaa gacaatggca ttaaacatgg agggctagac ctcactacta acaattcctc ctcgactacc tcctccaaca cttccaaagc atcaccacca ataactcatc attccatagt gaatggacag tcttcagttc taagtgcaag acgagacagc Hämta den, kopiera sekvensen och klistra in den i ”frågefönstret”. Välj ”Nucleotide collection” i rullgardinsmenyn, men i övrigt kan du använda förinställningarna för din BLAST. Nu kommer du att jämföra din inklistrade sekvens med alla DNA-sekvenser i databasen. (Pröva gärna andra inställningar om du får tid över och se vad de gör för skillnad.) När du klickat på BLAST kommer du så småningom att få upp sekvenser som matchar till den sekvens du BLASTat. Hur många baser i din sekvens matchar det du hittat (1)? Välj den översta matchningen och klicka på den för att få upp information för just den sekvensen. Skumma igenom texten för att hitta mer information om sekvensen. Varje sekvens i genbank identifieras med ett s.k. accessionsnummer. Vad är accessionsnumret för den träff du tittar på (2)? Vad heter genen och hur förkortas den (3)? I vilken art har man sekvenserat den här sekvensen (4) och hur lång var den sekvens man sekvenserade (5)? Försök också ta reda på från vilken kromosom sekvensen kommer (6), vilken vävnadstyp man hämtat DNA från (7) och de första 10 aminosyrorna i det protein som genen kodar för (8) (translation). Observera att man här använder enbokstavsförkortningar för aminosyrorna. (Fråga 6 och 7 kan man inte alltid hitta svaret på för alla sekvenser.) PubMed PubMed är en resurs för att hitta biomedicinsk litteratur. Gå tillbaka till NCBIs startsida och ta dig till PubMed. Sök efter genens namn (förkortningen). Hur många träffar får du (9)? Leta igenom listan tills du hittar den artikel som W. Enard är försteförfattare på (eller lägg till Enard som sökkriterium). Vad heter artikeln (10), i vilken tidskrift är den publicerad (11) och vilket år (12)? Vad är författarnas slutsats i artikeln (13)? OMIM OMIM är en katalog äver mänskliga genetiska sjukdomar. Gå hit från NCBIs startsida. Sök efter genen. När man först försökte kartera genen hamnade den inte på den kromosom man nu vet att den ligger på. (Om du inte kunde svara på fråga 6 tidigare, se om du kan hitta svaret här.) Till vilken kromosom karterades (mapping) genen först (14)? Haesler och kollegor studerade hur genen uttrycks i bland annat zebrafink och kanariefågel. Vad var deras slutsats om genens betydelse hos sångfåglar (15)? Om du har tid skumma gärna resten av texten för att se om du hittar något annat du tycker är intressant. MapViewer På MapViewer finns möjligheten att få en grafisk överblick över genomet. Gå hit från NCBIs startsida. Välj människans genom och sök på genen. Får du träff på rätt kromosom? Gå in på den kromosom genen sitter på för att få upp alla möjliga sorters information. Den information vi är intresserade av här är Genes seq där gener listas (klicka bort de andra om de stör). Ta reda på namnen på de gener som är närmast vår gen (mot centromeren på kromosomen och mot telomeren) (16). Zooma om det behövs. Genomiska verktyg Från NCBIs huvudsida finns länkar till en stor mängd verktyg för genomisk biologi. Välj HomoloGene där man kan jämföra samma gen i olika arter. Sök på genen. Hur många aminosyror långt är proteinet i de fyra arterna människa, chimpans, mus och råtta (17)? Här kan du också få upp en tabell med diverse evolutionära parametrar som beräknats när man jämfört genens sekvens i olika arter (show pairwise alignment scores). Man har jämfört varje art med samtliga övriga arter. Hur skiljer sig identiteten mellan två arter när man jämför DNA-sekvens och protein- (aminosyra-) sekvens (18)? Fundera på varför det kan vara så. Vad mäter det s.k. dN/dS förhållandet (19)? Om du jämför dN/dS-värdet mellan de olika arterna, kan du dra några slutsatser om hur genen evolverat (20)?