Seminarium MCB vt 2004 (FH och SA)

Seminarium CMB vt 2013
Sekvensering av DNA och bioinformatik
Förbered svar till uppgifterna så att ni är beredda och kan redogöra inför gruppen. Alla skall deltaga i
diskussionen. Notera ev. frågor eller oklarheter som du vill diskutera. Till hjälp finns frågor på baksidan av
detta papper. Litteratur: Lodish + lab manual, Lab PCR, Lab sekvensering.
Uppgift 1 Sekvensering av ett cDNA
Du har tagit fram nukleotidsekvensen för ett cDNA som motsvarar sekvensen för humana
tillväxtfaktorn – ”insulin-like growth factor 2” (IGF2) från två olika personer. Du finner en
nukleotidpolymorfism i en triplett, nt 685-688 – Person 1: tgt (kodar för C/Cys) samt person 2:
agt (kodar för S/Ser).
Förklara och beskriv:
a) Vad är ett cDNA?
b) Redogör för hur du bestämmer nukleotidsekvensen med hjälp av sanger-DNA sekvensering.
c) Förändringen i amino-syra sekvens C->S har stor betydelse för proteinets struktur. Förklara
varför.
Delar av humant IGF2 cDNA (nukleotid 541-1120). Den translaterade aminosyrasekvensen
visas under nukleotidsekvensen i enbokstavskod.
541 ttccagacaccaatgggaatcccaatggggaagtcgatgctggtgcttctcaccttcttg
M G I P M G K S M L V L L T F L
601 gccttcgcctcgtgctgcattgctgcttaccgccccagtgagaccctgtgcggcggggag
A F A S C C I A A Y R P S E T L C G G E
661 ctggtggacaccctccagttcgtctgtggggaccgcggcttctacttcagcaggcccgca
L V D T L Q F V C G D R G F Y F S R P A
721 agccgtgtgagccgtcgcagccgtggcatcgttgaggagtgctgtttccgcagctgtgac
S R V S R R S R G I V E E C C F R S C D
781 ctggccctcctggagacgtactgtgctacccccgccaagtccgagagggacgtgtcgacc
L A L L E T Y C A T P A K S E R D V S T
841 cctccgaccgtgcttccggacaacttccccagataccccgtgggcaagttcttccaatat
P P T V L P D N F P R Y P V G K F F Q Y
901 cccctgattgctctacccacccaagaccccgcccacgggggcgcccccccagagatggcc
P L I A L P T Q D P A H G G A P P E M A
961 agcaatcggaagtgagcaaaactgccgcaagtctgcagcccggcgccaccatcctgcagc
S N R K *
Uppgift 2. Organisationen av genomet och gener samt databassökningar.
Uppgiften blir att söka information om genen ABCA4 och dess struktur.
a) Förändringar i genen ger upphov till sjukdom – vilken sjukdom?
b) På vilken kromosom och var på kromosomen ligger genen hos människa?
c) Hur definieras gen och vilka delar/regioner består en gen av? Hur ligger dessa delar i
ABCA4 genen och hur lång är genen?
d) Är ABCA4 genen en enkel eller komplex transkriptionsenhet?
e) Vilka delar finns i ett mRNA? Hur långt är pre-mRNA respective mRNA för ABCA4?
f) Vad är ABCA4 proteinets naturliga funktion?
g) Hur många aminosyror innehåller det translaterade proteinet?
Information kan hittas i databaser som nås genom Genome-browsern på www.ensembl.org eller
några av de databaser som länkas från EnsEMBL.
1
Seminarium CMB vt 2013
Instuderingsfrågor som hjälp till seminsariumet:
1. Vilka principiellt olika metoder finns det att sekvensera DNA? Vad kallas de och hur skiljer
de sig åt?
2. Beskriv översiktligt hur elektrofores av nukleinsyra går till (kapillärelektrofores respektive
PolyAkrylamid-GelElektrofores PAGE).
3. Vad är en dideoxynukleotid? Varför används dideoxynukleotider vid Sanger sekvensering?
4. Vad är en sekvensprimer och var i en kloningsvektor brukar en sekvensprimer baspara? Hur
är 3’ resp 5’ riktade jämfört med den bit DNA som man vill sekvensera. Beskriv och
motivera.
5. Man använder fluorescens vid sekvensering. Vad fluorescerar och hur detekteras
fluorescensen?
6. Varför brukar man köra sekvensreaktioner i en PCR-maskin?
7. Vad är ett elektroferogram? Beskriv utseende och vad det beskriver. Vad beskriver axlarna i
diagrammet?
8. Hur fungerar ”PYRO” sekvensering? ( http://www.pyrosequencing.com/DynPage.aspx?id=7454 )
9. Vad menas med kodande respektive icke-kodande DNA-strängen?
10. Vad är ett anti-kodon? Kan aminosyrasekvensen avläsas på kodande strängen eller den ickekodande strängen? Vilken sträng fungerar som mall vid transkriptionen? Vilka aminosyror
motsvarar sekvensen GATATTAGCATT ?
11. Vad menas med att den genetiska koden är degenererad?
12. Vad kallas de gener som kodar för samma protein men som kommer från olika arter? Tex
insulin från krokodil och insulin från människa?
13. Vad kallas gener som uppkommit genom genduplikation(er) och som alla finns i samma arts
genom? Tex människans insulin, insulin-like growth factor 1 och 2 (IGF1 och IGF2).
14. Idag kan man sekvensera 100-500 x106 bp per analys! Hur kan det vara möjligt och hur går
det till?
15. Två dominerande teknologier finns: ”Illumina Solexa Genome analyser” samt ”Roche 454
GS”. Vilken av dessa använder PYRO sequencing? Beskriv i princip/ i korta drag hur
storskalig sekvensering går till.
Länkar :
Illumina Solexa:
http://www.illumina.com/Media/flash_player.ilmn?dirname=systems&swfname=GA_workflow_vid&width=780&height=485&i
frame
http://www.illumina.com/Documents/products/Illumina_Sequencing_Introduction.pdf
Pyro seq: http://www.pyrosequencing.com/DynPage.aspx?id=7454
ROCHE – 454 seq: http://454.com/resources-support/product-videos.asp
2