Seminarium CMB vt 2013 Sekvensering av DNA och bioinformatik Förbered svar till uppgifterna så att ni är beredda och kan redogöra inför gruppen. Alla skall deltaga i diskussionen. Notera ev. frågor eller oklarheter som du vill diskutera. Till hjälp finns frågor på baksidan av detta papper. Litteratur: Lodish + lab manual, Lab PCR, Lab sekvensering. Uppgift 1 Sekvensering av ett cDNA Du har tagit fram nukleotidsekvensen för ett cDNA som motsvarar sekvensen för humana tillväxtfaktorn – ”insulin-like growth factor 2” (IGF2) från två olika personer. Du finner en nukleotidpolymorfism i en triplett, nt 685-688 – Person 1: tgt (kodar för C/Cys) samt person 2: agt (kodar för S/Ser). Förklara och beskriv: a) Vad är ett cDNA? b) Redogör för hur du bestämmer nukleotidsekvensen med hjälp av sanger-DNA sekvensering. c) Förändringen i amino-syra sekvens C->S har stor betydelse för proteinets struktur. Förklara varför. Delar av humant IGF2 cDNA (nukleotid 541-1120). Den translaterade aminosyrasekvensen visas under nukleotidsekvensen i enbokstavskod. 541 ttccagacaccaatgggaatcccaatggggaagtcgatgctggtgcttctcaccttcttg M G I P M G K S M L V L L T F L 601 gccttcgcctcgtgctgcattgctgcttaccgccccagtgagaccctgtgcggcggggag A F A S C C I A A Y R P S E T L C G G E 661 ctggtggacaccctccagttcgtctgtggggaccgcggcttctacttcagcaggcccgca L V D T L Q F V C G D R G F Y F S R P A 721 agccgtgtgagccgtcgcagccgtggcatcgttgaggagtgctgtttccgcagctgtgac S R V S R R S R G I V E E C C F R S C D 781 ctggccctcctggagacgtactgtgctacccccgccaagtccgagagggacgtgtcgacc L A L L E T Y C A T P A K S E R D V S T 841 cctccgaccgtgcttccggacaacttccccagataccccgtgggcaagttcttccaatat P P T V L P D N F P R Y P V G K F F Q Y 901 cccctgattgctctacccacccaagaccccgcccacgggggcgcccccccagagatggcc P L I A L P T Q D P A H G G A P P E M A 961 agcaatcggaagtgagcaaaactgccgcaagtctgcagcccggcgccaccatcctgcagc S N R K * Uppgift 2. Organisationen av genomet och gener samt databassökningar. Uppgiften blir att söka information om genen ABCA4 och dess struktur. a) Förändringar i genen ger upphov till sjukdom – vilken sjukdom? b) På vilken kromosom och var på kromosomen ligger genen hos människa? c) Hur definieras gen och vilka delar/regioner består en gen av? Hur ligger dessa delar i ABCA4 genen och hur lång är genen? d) Är ABCA4 genen en enkel eller komplex transkriptionsenhet? e) Vilka delar finns i ett mRNA? Hur långt är pre-mRNA respective mRNA för ABCA4? f) Vad är ABCA4 proteinets naturliga funktion? g) Hur många aminosyror innehåller det translaterade proteinet? Information kan hittas i databaser som nås genom Genome-browsern på www.ensembl.org eller några av de databaser som länkas från EnsEMBL. 1 Seminarium CMB vt 2013 Instuderingsfrågor som hjälp till seminsariumet: 1. Vilka principiellt olika metoder finns det att sekvensera DNA? Vad kallas de och hur skiljer de sig åt? 2. Beskriv översiktligt hur elektrofores av nukleinsyra går till (kapillärelektrofores respektive PolyAkrylamid-GelElektrofores PAGE). 3. Vad är en dideoxynukleotid? Varför används dideoxynukleotider vid Sanger sekvensering? 4. Vad är en sekvensprimer och var i en kloningsvektor brukar en sekvensprimer baspara? Hur är 3’ resp 5’ riktade jämfört med den bit DNA som man vill sekvensera. Beskriv och motivera. 5. Man använder fluorescens vid sekvensering. Vad fluorescerar och hur detekteras fluorescensen? 6. Varför brukar man köra sekvensreaktioner i en PCR-maskin? 7. Vad är ett elektroferogram? Beskriv utseende och vad det beskriver. Vad beskriver axlarna i diagrammet? 8. Hur fungerar ”PYRO” sekvensering? ( http://www.pyrosequencing.com/DynPage.aspx?id=7454 ) 9. Vad menas med kodande respektive icke-kodande DNA-strängen? 10. Vad är ett anti-kodon? Kan aminosyrasekvensen avläsas på kodande strängen eller den ickekodande strängen? Vilken sträng fungerar som mall vid transkriptionen? Vilka aminosyror motsvarar sekvensen GATATTAGCATT ? 11. Vad menas med att den genetiska koden är degenererad? 12. Vad kallas de gener som kodar för samma protein men som kommer från olika arter? Tex insulin från krokodil och insulin från människa? 13. Vad kallas gener som uppkommit genom genduplikation(er) och som alla finns i samma arts genom? Tex människans insulin, insulin-like growth factor 1 och 2 (IGF1 och IGF2). 14. Idag kan man sekvensera 100-500 x106 bp per analys! Hur kan det vara möjligt och hur går det till? 15. Två dominerande teknologier finns: ”Illumina Solexa Genome analyser” samt ”Roche 454 GS”. Vilken av dessa använder PYRO sequencing? Beskriv i princip/ i korta drag hur storskalig sekvensering går till. Länkar : Illumina Solexa: http://www.illumina.com/Media/flash_player.ilmn?dirname=systems&swfname=GA_workflow_vid&width=780&height=485&i frame http://www.illumina.com/Documents/products/Illumina_Sequencing_Introduction.pdf Pyro seq: http://www.pyrosequencing.com/DynPage.aspx?id=7454 ROCHE – 454 seq: http://454.com/resources-support/product-videos.asp 2