Prokaryota genom II 21 februari 2005 Jan Andersson Insitutionen för Cell- och Molekylärbiologi Avdelning för Mikrobiologi [email protected] 1 Jämförande genomik • Hundratals prokaryota genom tillgängliga • Alla organismer i trädet har olika levnadssätt som återspeglas i genomet och dess historia • Jämförande studier av dessa ger information om hur genomen förändras över tiden – Förlust av överflödiga gener – Duplikationer av befintliga gener – Introduktion av nya gener 2 Genomstorlek och geninnehåll • Storleken på prokaryota genom varierar från 0,5 till 10 Mbp motsvarande 500 till 10000 gener • De mindre genomen är prokaryoter som lever som symbionter eller obligata parasiter – d v s de kan inte överleva i frånvaro av deras värdceller (oftast eukaryoter, t ex människan) • Eftersom prokaryoter är äldre än eukaryoter är det troligt att symbionterna och de obligata parasiterna utvecklats från fritt levande prokaryoter • De fritt levande anfäderna hade med största sannolikhet större genom med fler gener 3 Genomstorlek och antal gener i prokaryoter Röda rektanglar: Arkeer; Gröna trianglar: Obligat parasiter; Blå fyrkanter: Övriga bakterier 4 Minimala genomet • När två genom fanns tillgängliga gjordes en jämförelse vilka gener som fanns i båda – dessa antogs då motsvara den minimala uppsättningen gener som behövs för cellulär liv (minimala genomet) – De var ca 300 när Haemophilus influenzae och Mycoplasma genitalium jämfördes 5 Minimala genomet • Numera är det endast 15-20 gener som har återfunnits i alla genom – alla inblandade i centrala uppgifter såsom translation och replikation – Dessa kan omöjligt klara att upprätthålla cellulärt liv • Slutsats: samma essentiella funktioner kan utföras av olika gener – genomet är mer flexibelt än man tidigare trott 6 Genomdegradering - Rickettsia • Rickettsia prowazekii är en obligat intracellulär parasit orsakar tyfus Translation, ribosomal structure and biogenesis R. prowazekii E. coli Transcription • Förhållandet mellan antalet gener i olika funktionella grupper avspeglar detta levnadssätt – R. prowazekii lever i en konstant och näringsrik miljö få gener som kodar för protein med metabolisk funktion behövs DNA replication, recombination and repair Cell division and chromosome partitioning Posttranslational modification, protein turnover, chaperones Cell envelope biogenesis, outer membrane Cell motility and secretion Inorganic ion transport and metabolism Metaboliska gener Signal transduction mechanisms Carbohydrate transport and metabolism Energy production and conversion Amino acid transport and metabolism Nucleotide transport and metabolism Coenzyme metabolism – Escherichia coli är en fritt levande bakterie som behöver kunna utnyttja de metaboliter som finns tillgängliga – mer anpassningsbar Lipid metabolism General function prediction only Function unknown 0 50 100 150 200 250 300 350 Number of COGs 7 Genomdegradering - Rickettsia • Rickettsia prowazekii har flera psudogener och en låg andel kodande DNA – 24% av genomet är icke-kodande och många långa regioner utan funktionella gener hittades • Vår hypotes var att pseudogenerna motsvarade gener som inte längre selekteras p g a ändrad levnadsmiljö och att de långa icke-kodande regionerna bestod av tidigare inaktiverade gener som inte längre var identifierbara och på väg bort från genomet 8 Pågående genomdegradering hos Rickettsia • Jämförande sekvensstudier på olika Rickettsia-arter visade att så var fallet 9 Rickettsia har en stor andel pseudogener p g a aktiv genomdegradering • M h a utökade studier av fyra Rickettsia-arter visades det sig att det i princip alltid fanns en eller flera kodande gener, eller rester av sådana, i de långa icke-kodande regionerna hos R. prowazekii • Genomsekvensen från Rickettsia conorii verifierade denna hypotes 10 Deletioner dominerar 11 Vilka gener förloras? • Intracellulära bakterier degraderar olika reaktionsvägar 12 Horisontell genöverföring • Vad är horisontell genöverföring? – Överföring av genetisk material mellan avlägsna släktingar • Motsats: vertikal nedärvning – det genetiska materialet ärvs från anfäder • Exempel: Överföring av antibiotikaresistens mellan bakterier • Hur går det till? – Konjugation – bakterier utbyter genetisk information genom fysisk kontakt, hela genomet kan i princip föras över i en följd – Transduktion – överföring av små fragment via bakteriofager (virus) – Transformation – prokaryota celler tar upp DNA-molekyler från omgivningen, troligen i syfte att använda det som mat • Hur vanligt är det? – Vanligare än man trodde för 10 år sedan – Hett debatterat… 13 Hur detekteras horisontell genöverföring? • Sekvensmönster – Annorlunda GC-halt – Annorlunda kodonanvändning • Icke förväntade sekvenslikheter (BLAST) • Fylogenetiska metoder • Gendistribution Idealt används kombinationer av dessa metoder för att påvisa överföringar 14 Identifiering av genöverföringar m h a sekvensmönster • Lawrence and Ochman utnyttjade att nyligen introducerade gener i ett genom har avvikande GC-innehåll – dessa gener borde reflektera genomet i stort i den organism de kommer ifrån • De definierade en gen som avvikande om den skiljde sig mer än 8% i GChalten i första och tredje positionen • På detta sätt kunde de identifiera 755 ORFs i E. colis genom som troligen har ett ursprung från andra arter 15 Tiden sedan överföringen kan räknas ut 16 Problem med sekvensmönstermetoder • Saknas detaljerad förståelse för kodonanvändning och GC-innehåll – andra faktorer än genöverföringar kan orsaka avvikande mönster • Oklart hur man ska definiera ”avvikande” • Identifierar enbart överföringar som skett nyligen • Identifierar ej överföringar från arter med liknande GC-innehåll eller kodonanvändning 17 Identifiering av genöverföringar med BLAST • ”Oväntad bästa sekvenslikhet” har ofta används som indikator på horisontell genöverföing – Bästa träffen i BLAST-sökning antas vara den mest relaterade sekvensen – om denna inte är den förväntade närmaste släktingen antas att en genöverföring skett • Exempel: Om en människogen får bästa träff till en bakteriegen i en BLAST-sökning kan detta förklaras med att genen överförts från bakterien till människan 18 Thermotoga maritima • Thermotoga är en stavformad bakterie som upptäcktes vid upphettade havssediment vid Vulcano i Italien • Den har en optimal tillväxt vid 80ºC och bryter ned komplexa kolhydrater med bl a vätgas som slutprodukt • Evolutionärt intressant eftersom den troligen är en av de tidigaste förgrenade bakterien • Största överraskningen från genomsekvensen som publicerades 1999 var att 24% av alla gener visade störst likhet i BLAST-sökningar med gener från Archaea • Horisontell genöverföring användes för att förklara observationen att generna har överförts mellan Archaea och Thermotoga förfäder efter att Thermotoga förgrenades från andra bakterier 19 20 Problem med BLAST-metoden • Bästa sekvenslikhet innebär inte nödvändigtvis närmast släkt Tre exempel på evolutionära händelseförlopp där en BLAST-sökning skulle visa största sekvenslikhet mellan människa och bakterie – Endast c har orsakats av en horisontell genöverföring 21 Identifiering av genöverföringar med fylogenetiska metoder • Med fylogenetiska metoder fås relationerna mellan många sekvenser samtidigt • Mottagaren av en genöverföring återfinns inuti gruppen som var givare i överföringen (idealt) • Eftersom fylogenetiska metoder är utvecklade för att återskapa evolutionära släktskap mellan sekvenser är de överlägsna t ex BLAST-sökningar för visa och motbevisa genöverföringar 22 Glutamat dehydrogenase • Fylogenetiskt träd baserat på glutamat dehydrogenase • Släktskapen mellan sekvenserna överrensstämmer inte med de förväntade släktskapen mellan de inkludera organismerna – T ex är eukaryoterna och proteobakterierna utspridda i många grupper 23 Problem med fylogenetiska metoder som identifieringsmetod för genöverföringar • Fylogenetiska metoderna ej perfekta – risk att dra felaktiga slutsatser från resultat som baserar sig på systematiska ”fel” i sekvenserna (t ex GC-halt i genomen) • Även perfekta träd kräver mycket tolkning av biologen – oftast kan flera olika evolutionära händelseförlopp vara tänkbara för att förklara träden • Svårt att automatisera – för att få fylogenetiska träd av hög kvalitet kräver arbete från biologisk kunniga forskare 24 Identifiering av genöverföringar med gendistribution • På senare tid har allt fler genom från olika stammar av samma art blivit tillgängliga • Trots att stammarna har hög sekvenslikhet (som väntat) finns det oftast en relativt stor del unika gener i vardera stammarna 25 Prochlorococcus • Cyanobakterie – den minsta kända fotosyntetiska syrebildande organismen (diameter: 0,6 µm) • Dominerande plankton (i antal) i tropiska hav • Två stammar sekvenserade: MED4 och MIT9313 • De har 1716 respektive 2275 gener, varav 1350 finns i båda stammarna 26 Evolution av genomen hos Prochlorococcus • Kryssen visar positionen för orfologa gener – Omorganisationer symmetriska runt oriC • Kryssen på axlarna visar positionen för unika gener för stammen – De är fördelade över hela genomet 27 Exempel på skillnader i genomen hos Prochlorococcus • Introduktion av gener involverade i syntes och transport av kolhydrater i MIT9313-genomet via horisontell genöverföring 28 De två stammarna av Prochlorococcus är optimerade för olika miljöer • De två stammarna har olika djupoptimum i havet • Skillnaderna i genomen återspeglar antagligen de olika förutsättningarna i de olika miljöerna 29 Escherichia coli – en art? • Escherichia coli återfinns i tarmen hos djur och människor, men kan också leva fritt utanför djuren – Oftast är den ofarlig för värden, men vissa stammar är patogena med allvarliga följder (t ex EHEC) • Jämförelse mellan tre stammar av E. coli; K-12 (labstam), CFT073 som orsakar urinvägsinfektion, och O157:H7 som orsakat ”hamburger disease” i USA visar att de skiljer sig väldigt mycket, antagligen p g a mycket genöverföringar • Genomet av en stam av E. coli inte tillräcklig för att beskriva ”E. colis genom” 30 Problem med gendistribution som identifieringsmetod • Omöjligt att veta om en enskild gen som är unik för en stam har tagit upp av denna, eller om genen förlorats i den andra stammen – Ju fler närbesläktade stammar/arter, desto mindre problem 31 Mönster av genöverföringar ”Complexity hypothesis” • Gener som kodar för metaboliska proteiner med få interaktioner med andra komponenter i cellen genomgår horisontell genöverföring relativt ofta • Gener som kodar för proteiner med många interaktioner med andra proteiner i cellen, t ex i translation- och transkriptionmaskinerierna, överförs mer sällan • Detta kan förklaras med att proteiner med få interaktioner är lätt utbytbara, medan proteiner med många interaktioner har evolverat tillsammans med proteinerna de interagerar med och därför är svårare att byta ut 32 Mönster av genöverföringar • Gener överförs från arter som finns i närmiljön – Arter som lever tillsammans med många andra prokaryoter överför gener i stor utsträckning – Intracellulära parasiter och symbionter kommer i kontakt med få andra prokaryoter – de påverkas därför litet av genöverföringar 33 Innehållet i genomet hos mikroorganismer består av en stabil kärna med ett variabelt hölje • Hastigheten för den horisontella överföringarna varierar stort för olika typer av gener – Vissa gener är väldigt svåra att byta ut och är därför lämpliga att använda som fylogenetiska markörer (proteiner med många interaktioner) – Andra gener byts ut med relativt hög frekvens och är olämpliga att använda som markörer för släktskap mellan organismer • Vad är en ”art” av en mikroorganism? 34 Evolutionen av mikroorganismer kanske bättre representeras av ett nät än ett träd Tidigare modell Modell som tar med kunskapen från jämförande genomik 35