Seminarium CMB vt 2014 Sekvensering av DNA och bioinformatik Förbered svar till uppgifterna så att ni är beredda och kan redogöra inför gruppen. Alla skall deltaga i diskussionen. Notera ev. frågor eller oklarheter som du vill diskutera. Till hjälp finns frågor på baksidan av detta papper. Litteratur: Lodish + lab manual, Lab PCR, Lab sekvensering. Uppgift 1 Sekvensering av ett cDNA Du har tagit fram nukleotidsekvensen för ett cDNA som motsvarar sekvensen för humana tillväxtfaktorn – ”insulin-like growth factor 2” (IGF2) från två olika personer. Du finner en nukleotidpolymorfism i en triplett, nt 685-688 – Person 1: tgt (kodar för C/Cys) samt person 2: agt (kodar för S/Ser). Förklara och beskriv: a) Vad är ett cDNA och hur gör man det? b) Redogör för hur du bestämmer nukleotidsekvensen med hjälp av Sanger-DNA sekvensering. c) Förändringen i amino-syra sekvens C->S har stor betydelse för proteinets struktur. Förklara varför. Delar av humant IGF2 cDNA (nukleotid 541-1120). Den translaterade aminosyrasekvensen visas under nukleotidsekvensen i enbokstavskod. 541 ttccagacaccaatgggaatcccaatggggaagtcgatgctggtgcttctcaccttcttg M G I P M G K S M L V L L T F L 601 gccttcgcctcgtgctgcattgctgcttaccgccccagtgagaccctgtgcggcggggag A F A S C C I A A Y R P S E T L C G G E 661 ctggtggacaccctccagttcgtctgtggggaccgcggcttctacttcagcaggcccgca L V D T L Q F V C G D R G F Y F S R P A 721 agccgtgtgagccgtcgcagccgtggcatcgttgaggagtgctgtttccgcagctgtgac S R V S R R S R G I V E E C C F R S C D 781 ctggccctcctggagacgtactgtgctacccccgccaagtccgagagggacgtgtcgacc L A L L E T Y C A T P A K S E R D V S T 841 cctccgaccgtgcttccggacaacttccccagataccccgtgggcaagttcttccaatat P P T V L P D N F P R Y P V G K F F Q Y 901 tcccagggaaaatgagcaaaactgccgcaagtctgcagcccggcgccaccatcctgcagc S Q G K * Uppgift 2. Organisationen av genomet och gener samt databassökningar. Uppgiften blir att söka information om genen ABCA4 och dess struktur. a) På vilken kromosom och var på kromosomen ligger genen hos människa? Forward eller reverse strand? b) Hur definieras begreppet gen och vilka delar/regioner består en gen av? c) Hur ligger dessa delar i ABCA4 genen och hur lång del av det genoiska DNAt sträcker sig genen över? d) Är ABCA4 genen en enkel eller komplex transkriptionsenhet? e) Hur ser ett mRNA generellt ut? Vilka delar finns i mRNA? Hur långa är pre-mRNAt respektive mRNAt för ABCA4? f) Hur många aminosyror är det translaterade proteinet? g) Vad är ABCA4 proteinets naturliga funktion och vilken sjukdom kan mutationer i ABCA4 ge upphov till? Information kan hittas i databaser som nås genom Genome-browsern på www.ensembl.org eller några av de databaser som länkas från EnsEMBL. 1 Seminarium CMB vt 2014 Instuderingsfrågor som hjälp till seminariumet: Dessa frågor kommer ej att gås igenom om ni inte specifikt vill det. 1. Vilka principiellt olika metoder finns det att sekvensera DNA? Vad kallas de och hur skiljer de sig åt? 2. Beskriv översiktligt hur elektrofores av nukleinsyra går till (kapillärelektrofores respektive PolyAkrylamid-GelElektrofores PAGE). 3. Vad är en dideoxynukleotid? Varför används dideoxynukleotider vid Sanger-sekvensering? 4. Vad är en sekvensprimer och var i en kloningsvektor brukar en sekvensprimer baspara? Hur är 3’ resp 5’ riktade jämfört med den bit DNA som man vill sekvensera. Beskriv och motivera. 5. Man använder fluorescens vid sekvensering. Vad fluorescerar och hur detekteras fluorescensen? 6. Varför brukar man köra sekvensreaktioner i en PCR-maskin? 7. Vad är den viktiga skillnaden mellan en PCR och sekvensreaktion? 8. Vad är ett elektroferogram? Beskriv utseende och vad det beskriver. Vad beskriver axlarna i diagrammet? 9. Hur fungerar ”PYRO” sekvensering? 10. Vad menas med ”sense/kodande” respektive ”non-sense/icke kodande” DNA-strängen? 11. Vad är ett anti-kodon? Kan aminosyrasekvensen avläsas på kodande strängen eller den ickekodande strängen? Vilken sträng fungerar som mall vid transkriptionen? Vilka aminosyror motsvarar sekvensen GATATTAGCATT ? 12. Vad menas med att den genetiska koden är degenererad? 13. Vad kallas de gener som kodar för samma protein men som kommer från olika arter? Tex insulin från krokodil och insulin från människa? 14. Vad kallas gener som uppkommit genom genduplikation(er) och som alla finns i en arts genom? Tex människans insulin, insulin-like growth factor 1 och 2 (IGF1 och IGF2). 15. Idag kan man sekvensera 100-500 x106 bp per analys! Hur kan det vara möjligt och hur går det till? 16. Två dominerande teknologier finns: ”Illumina Solexa Genome analyser” samt ”Roche 454 GS”. Vilken av dessa använder PYRO sequencing? Beskriv i princip/ i korta drag hur storskalig sekvensering går till. Länkar till förtagen som producerar och gör teknologin: Illumina Solexa: http://www.illumina.com (ta del av videon från menyn nertill på hemsidan) http://www.illumina.com/Documents/products/Illumina_Sequencing_Introduction.pdf Pyro seq: http://www.qiagen.com/knowledge-and-support/videos-and-virtualdemos/videos/pyrosequencing%20cascade%20reaction/ ROCHE – 454 seq: http://454.com/resources-support/product-videos.asp 2