Genomik på internet
Bakgrund
Genetisk och genomisk forskning genererar stora mängder data. Mycket av detta finns
tillgängligt i offentliga databaser tillsammans med stora mängder data från annan biologisk forskning. Med den här labben hoppas jag att du ska få en liten introduktion till en
del av den genetiska information man kan hitta på nätet.
BLAST
NCBI (National Center for Biotechnology Information) http://www.ncbi.nlm.nih.gov/
är en amerikansk portal som startades 1988 som en nationell (amerikansk) resurs för
molekylärbiologisk information. Det är ett utmärkt ställe att börja söka information på.
Här kan man bland annat använda sig av BLAST (Basic Local Alignment Search Tool), ett
verktyg för att jämföra en DNA-sekvens med de som finns lagrade i den stora databasen
GenBank. Klicka dig fram till sidan för BLAST och välj ”nucleotide blast”.
Följande sekvens finns att hämta på kurshemsidan:
aaagaagtga ctggagttca cagtatggaa gacaatggca ttaaacatgg agggctagac ctcactacta acaattcctc ctcgactacc tcctccaaca cttccaaagc atcaccacca ataactcatc attccatagt gaatggacag tcttcagttc taagtgcaag acgagacagc
Hämta den, kopiera sekvensen och klistra in den i ”frågefönstret”. Välj ”Nucleotide collection” i rullgardinsmenyn, men i övrigt kan du använda förinställningarna för din BLAST.
Nu kommer du att jämföra din inklistrade sekvens med alla DNA-sekvenser i databasen.
(Pröva gärna andra inställningar om du får tid över och se vad de gör för skillnad.)
När du klickat på BLAST kommer du så småningom att få upp sekvenser som matchar
till den sekvens du BLASTat. Hur många baser i din sekvens matchar det du hittat (1)?
Välj den översta matchningen och klicka på den för att få upp information för just den
sekvensen. Skumma igenom texten för att hitta mer information om sekvensen.
Varje sekvens i genbank identifieras med ett s.k. accessionsnummer. Vad är accessionsnumret för den träff du tittar på (2)?
Vad heter genen och hur förkortas den (3)?
I vilken art har man sekvenserat den här sekvensen (4) och hur lång var den sekvens man
sekvenserade (5)? Försök också ta reda på från vilken kromosom sekvensen kommer (6),
vilken vävnadstyp man hämtat DNA från (7) och de första 10 aminosyrorna i det protein som genen kodar för (8) (translation). Observera att man här använder enbokstavsförkortningar för aminosyrorna. (Fråga 6 och 7 kan man inte alltid hitta svaret på för alla
sekvenser.)
PubMed
PubMed är en resurs för att hitta biomedicinsk litteratur. Gå tillbaka till NCBIs startsida
och ta dig till PubMed. Sök efter genens namn (förkortningen). Hur många träffar får du
(9)?
Leta igenom listan tills du hittar den artikel som W. Enard är försteförfattare på (eller lägg
till Enard som sökkriterium). Vad heter artikeln (10), i vilken tidskrift är den publicerad
(11) och vilket år (12)?
Vad är författarnas slutsats i artikeln (13)?
OMIM
OMIM är en katalog äver mänskliga genetiska sjukdomar. Gå hit från NCBIs startsida.
Sök efter genen. När man först försökte kartera genen hamnade den inte på den kromosom
man nu vet att den ligger på. (Om du inte kunde svara på fråga 6 tidigare, se om du kan
hitta svaret här.) Till vilken kromosom karterades (mapping) genen först (14)? Haesler
och kollegor studerade hur genen uttrycks i bland annat zebrafink och kanariefågel. Vad
var deras slutsats om genens betydelse hos sångfåglar (15)? Om du har tid skumma gärna
resten av texten för att se om du hittar något annat du tycker är intressant.
MapViewer
På MapViewer finns möjligheten att få en grafisk överblick över genomet. Gå hit från
NCBIs startsida. Välj människans genom och sök på genen. Får du träff på rätt kromosom? Gå in på den kromosom genen sitter på för att få upp alla möjliga sorters information. Den information vi är intresserade av här är Genes seq där gener listas (klicka
bort de andra om de stör). Ta reda på namnen på de gener som är närmast vår gen (mot
centromeren på kromosomen och mot telomeren) (16). Zooma om det behövs.
Genomiska verktyg
Från NCBIs huvudsida finns länkar till en stor mängd verktyg för genomisk biologi. Välj
HomoloGene där man kan jämföra samma gen i olika arter. Sök på genen. Hur många
aminosyror långt är proteinet i de fyra arterna människa, chimpans, mus och råtta (17)?
Här kan du också få upp en tabell med diverse evolutionära parametrar som beräknats
när man jämfört genens sekvens i olika arter (show pairwise alignment scores). Man har
jämfört varje art med samtliga övriga arter. Hur skiljer sig identiteten mellan två arter
när man jämför DNA-sekvens och protein- (aminosyra-) sekvens (18)? Fundera på varför
det kan vara så.
Vad mäter det s.k. dN/dS förhållandet (19)? Om du jämför dN/dS-värdet mellan de olika
arterna, kan du dra några slutsatser om hur genen evolverat (20)?