Seminarium MCB vt 2004 (FH och SA)

Seminarium CMB vt 2014
Sekvensering av DNA och bioinformatik
Förbered svar till uppgifterna så att ni är beredda och kan redogöra inför gruppen. Alla skall deltaga i
diskussionen. Notera ev. frågor eller oklarheter som du vill diskutera. Till hjälp finns frågor på baksidan av
detta papper. Litteratur: Lodish + lab manual, Lab PCR, Lab sekvensering.
Uppgift 1 Sekvensering av ett cDNA
Du har tagit fram nukleotidsekvensen för ett cDNA som motsvarar sekvensen för humana
tillväxtfaktorn – ”insulin-like growth factor 2” (IGF2) från två olika personer. Du finner en
nukleotidpolymorfism i en triplett, nt 685-688 – Person 1: tgt (kodar för C/Cys) samt person 2:
agt (kodar för S/Ser).
Förklara och beskriv:
a) Vad är ett cDNA och hur gör man det?
b) Redogör för hur du bestämmer nukleotidsekvensen med hjälp av Sanger-DNA sekvensering. c)
Förändringen i amino-syra sekvens C->S har stor betydelse för proteinets struktur. Förklara varför.
Delar av humant IGF2 cDNA (nukleotid 541-1120). Den translaterade aminosyrasekvensen visas
under nukleotidsekvensen i enbokstavskod.
541 ttccagacaccaatgggaatcccaatggggaagtcgatgctggtgcttctcaccttcttg
M G I P M G K S M L V L L T F L
601 gccttcgcctcgtgctgcattgctgcttaccgccccagtgagaccctgtgcggcggggag
A F A S C C I A A Y R P S E T L C G G E
661 ctggtggacaccctccagttcgtctgtggggaccgcggcttctacttcagcaggcccgca
L V D T L Q F V C G D R G F Y F S R P A
721 agccgtgtgagccgtcgcagccgtggcatcgttgaggagtgctgtttccgcagctgtgac
S R V S R R S R G I V E E C C F R S C D
781 ctggccctcctggagacgtactgtgctacccccgccaagtccgagagggacgtgtcgacc
L A L L E T Y C A T P A K S E R D V S T
841 cctccgaccgtgcttccggacaacttccccagataccccgtgggcaagttcttccaatat
P P T V L P D N F P R Y P V G K F F Q Y
901 tcccagggaaaatgagcaaaactgccgcaagtctgcagcccggcgccaccatcctgcagc
S Q G K *
Uppgift 2. Organisationen av genomet och gener samt databassökningar.
Uppgiften blir att söka information om genen ABCA4 och dess struktur.
a) På vilken kromosom och var på kromosomen ligger genen hos människa? Forward eller
reverse strand?
b) Hur definieras begreppet gen och vilka delar/regioner består en gen av?
c) Hur ligger dessa delar i ABCA4 genen och hur lång del av det genoiska DNAt sträcker sig
genen över?
d) Är ABCA4 genen en enkel eller komplex transkriptionsenhet?
e) Hur ser ett mRNA generellt ut? Vilka delar finns i mRNA? Hur långa är pre-mRNAt
respektive mRNAt för ABCA4?
f) Hur många aminosyror är det translaterade proteinet?
g) Vad är ABCA4 proteinets naturliga funktion och vilken sjukdom kan mutationer i ABCA4
ge upphov till?
Information kan hittas i databaser som nås genom Genome-browsern på www.ensembl.org eller
några av de databaser som länkas från EnsEMBL.
1
Seminarium CMB vt 2014
Instuderingsfrågor som hjälp till seminariumet:
Dessa frågor kommer ej att gås igenom om ni inte specifikt vill det.
1. Vilka principiellt olika metoder finns det att sekvensera DNA? Vad kallas de och hur skiljer de
sig åt?
2. Beskriv översiktligt hur elektrofores av nukleinsyra går till (kapillärelektrofores respektive
PolyAkrylamid-GelElektrofores PAGE).
3. Vad är en dideoxynukleotid? Varför används dideoxynukleotider vid Sanger-sekvensering?
4. Vad är en sekvensprimer och var i en kloningsvektor brukar en sekvensprimer baspara? Hur är
3’ resp 5’ riktade jämfört med den bit DNA som man vill sekvensera. Beskriv och motivera.
5. Man använder fluorescens vid sekvensering. Vad fluorescerar och hur detekteras
fluorescensen?
6. Varför brukar man köra sekvensreaktioner i en PCR-maskin?
7. Vad är den viktiga skillnaden mellan en PCR och sekvensreaktion?
8. Vad är ett elektroferogram? Beskriv utseende och vad det beskriver. Vad beskriver axlarna i
diagrammet?
9. Hur fungerar ”PYRO” sekvensering?
10. Vad menas med ”sense/kodande” respektive ”non-sense/icke kodande” DNA-strängen?
11. Vad är ett anti-kodon? Kan aminosyrasekvensen avläsas på kodande strängen eller den ickekodande strängen? Vilken sträng fungerar som mall vid transkriptionen? Vilka aminosyror
motsvarar sekvensen GATATTAGCATT ?
12. Vad menas med att den genetiska koden är degenererad?
13. Vad kallas de gener som kodar för samma protein men som kommer från olika arter? Tex
insulin från krokodil och insulin från människa?
14. Vad kallas gener som uppkommit genom genduplikation(er) och som alla finns i en arts
genom? Tex människans insulin, insulin-like growth factor 1 och 2 (IGF1 och IGF2).
15. Idag kan man sekvensera 100-500 x106 bp per analys! Hur kan det vara möjligt och hur går det
till?
16. Två dominerande teknologier finns: ”Illumina Solexa Genome analyser” samt ”Roche 454
GS”. Vilken av dessa använder PYRO sequencing? Beskriv i princip/ i korta drag hur
storskalig sekvensering går till.
Länkar till förtagen som producerar och gör teknologin:
Illumina Solexa: http://www.illumina.com
(ta del av videon från menyn nertill på hemsidan)
http://www.illumina.com/Documents/products/Illumina_Sequencing_Introduction.pdf
Pyro seq: http://www.qiagen.com/knowledge-and-support/videos-and-virtualdemos/videos/pyrosequencing%20cascade%20reaction/
ROCHE – 454 seq: http://454.com/resources-support/product-videos.asp
2