Prokaryota genom II
21 februari 2005
Jan Andersson
Insitutionen för Cell- och Molekylärbiologi
Avdelning för Mikrobiologi
[email protected]
1
Jämförande genomik
•
Hundratals prokaryota genom
tillgängliga
•
Alla organismer i trädet har olika
levnadssätt som återspeglas i
genomet och dess historia
•
Jämförande studier av dessa ger
information om hur genomen
förändras över tiden
– Förlust av överflödiga gener
– Duplikationer av befintliga gener
– Introduktion av nya gener
2
Genomstorlek och geninnehåll
• Storleken på prokaryota genom varierar från 0,5 till 10 Mbp
motsvarande 500 till 10000 gener
• De mindre genomen är prokaryoter som lever som symbionter eller
obligata parasiter – d v s de kan inte överleva i frånvaro av deras
värdceller (oftast eukaryoter, t ex människan)
• Eftersom prokaryoter är äldre än eukaryoter är det troligt att
symbionterna och de obligata parasiterna utvecklats från fritt
levande prokaryoter
• De fritt levande anfäderna hade med största sannolikhet större
genom med fler gener
3
Genomstorlek och antal gener i prokaryoter
Röda rektanglar: Arkeer; Gröna trianglar: Obligat parasiter; Blå fyrkanter: Övriga bakterier
4
Minimala genomet
•
När två genom fanns tillgängliga
gjordes en jämförelse vilka gener
som fanns i båda – dessa antogs
då motsvara den minimala
uppsättningen gener som behövs
för cellulär liv (minimala genomet)
– De var ca 300 när Haemophilus
influenzae och Mycoplasma
genitalium jämfördes
5
Minimala genomet
• Numera är det endast 15-20 gener som har återfunnits i alla genom
– alla inblandade i centrala uppgifter såsom translation och
replikation
– Dessa kan omöjligt klara att upprätthålla cellulärt liv
• Slutsats: samma essentiella funktioner kan utföras av olika gener –
genomet är mer flexibelt än man tidigare trott
6
Genomdegradering - Rickettsia
•
Rickettsia prowazekii är en
obligat intracellulär parasit
orsakar tyfus
Translation, ribosomal structure and biogenesis
R. prowazekii
E. coli
Transcription
•
Förhållandet mellan antalet
gener i olika funktionella
grupper avspeglar detta
levnadssätt
– R. prowazekii lever i en
konstant och näringsrik miljö få gener som kodar för protein
med metabolisk funktion
behövs
DNA replication, recombination and repair
Cell division and chromosome partitioning
Posttranslational modification, protein turnover, chaperones
Cell envelope biogenesis, outer membrane
Cell motility and secretion
Inorganic ion transport and metabolism
Metaboliska
gener
Signal transduction mechanisms
Carbohydrate transport and metabolism
Energy production and conversion
Amino acid transport and metabolism
Nucleotide transport and metabolism
Coenzyme metabolism
– Escherichia coli är en fritt
levande bakterie som behöver
kunna utnyttja de metaboliter
som finns tillgängliga – mer
anpassningsbar
Lipid metabolism
General function prediction only
Function unknown
0
50
100
150
200
250
300
350
Number of COGs
7
Genomdegradering - Rickettsia
•
Rickettsia prowazekii har flera psudogener och en låg andel kodande
DNA – 24% av genomet är icke-kodande och många långa regioner
utan funktionella gener hittades
•
Vår hypotes var att pseudogenerna motsvarade gener som inte längre
selekteras p g a ändrad levnadsmiljö och att de långa icke-kodande
regionerna bestod av tidigare inaktiverade gener som inte längre var
identifierbara och på väg bort från genomet
8
Pågående genomdegradering hos Rickettsia
•
Jämförande sekvensstudier på olika Rickettsia-arter visade att så var fallet
9
Rickettsia har en stor andel pseudogener p g a
aktiv genomdegradering
•
M h a utökade studier av fyra Rickettsia-arter visades det sig att det i
princip alltid fanns en eller flera kodande gener, eller rester av sådana, i de
långa icke-kodande regionerna hos R. prowazekii
•
Genomsekvensen från Rickettsia conorii verifierade denna hypotes
10
Deletioner dominerar
11
Vilka gener förloras?
• Intracellulära bakterier degraderar olika reaktionsvägar
12
Horisontell genöverföring
•
Vad är horisontell genöverföring?
– Överföring av genetisk material mellan avlägsna släktingar
• Motsats: vertikal nedärvning – det genetiska materialet ärvs från anfäder
•
Exempel: Överföring av antibiotikaresistens mellan bakterier
•
Hur går det till?
– Konjugation – bakterier utbyter genetisk information genom fysisk kontakt,
hela genomet kan i princip föras över i en följd
– Transduktion – överföring av små fragment via bakteriofager (virus)
– Transformation – prokaryota celler tar upp DNA-molekyler från omgivningen,
troligen i syfte att använda det som mat
•
Hur vanligt är det?
– Vanligare än man trodde för 10 år sedan
– Hett debatterat…
13
Hur detekteras horisontell genöverföring?
• Sekvensmönster
– Annorlunda GC-halt
– Annorlunda kodonanvändning
• Icke förväntade sekvenslikheter (BLAST)
• Fylogenetiska metoder
• Gendistribution
Idealt används kombinationer av dessa metoder för att påvisa
överföringar
14
Identifiering av genöverföringar m h a
sekvensmönster
• Lawrence and Ochman utnyttjade att
nyligen introducerade gener i ett genom
har avvikande GC-innehåll – dessa
gener borde reflektera genomet i stort i
den organism de kommer ifrån
• De definierade en gen som avvikande
om den skiljde sig mer än 8% i GChalten i första och tredje positionen
• På detta sätt kunde de identifiera 755
ORFs i E. colis genom som troligen har
ett ursprung från andra arter
15
Tiden sedan överföringen kan räknas ut
16
Problem med sekvensmönstermetoder
• Saknas detaljerad förståelse för kodonanvändning och GC-innehåll
– andra faktorer än genöverföringar kan orsaka avvikande mönster
• Oklart hur man ska definiera ”avvikande”
• Identifierar enbart överföringar som skett nyligen
• Identifierar ej överföringar från arter med liknande GC-innehåll eller
kodonanvändning
17
Identifiering av genöverföringar med BLAST
• ”Oväntad bästa sekvenslikhet” har ofta används som indikator på
horisontell genöverföing
– Bästa träffen i BLAST-sökning antas vara den mest relaterade
sekvensen – om denna inte är den förväntade närmaste släktingen
antas att en genöverföring skett
• Exempel: Om en människogen får bästa träff till en bakteriegen i en
BLAST-sökning kan detta förklaras med att genen överförts från
bakterien till människan
18
Thermotoga maritima
•
Thermotoga är en stavformad bakterie som upptäcktes vid upphettade
havssediment vid Vulcano i Italien
•
Den har en optimal tillväxt vid 80ºC och bryter ned komplexa kolhydrater
med bl a vätgas som slutprodukt
•
Evolutionärt intressant eftersom den troligen är en av de tidigaste
förgrenade bakterien
•
Största överraskningen från genomsekvensen som publicerades 1999 var
att 24% av alla gener visade störst likhet i BLAST-sökningar med gener
från Archaea
•
Horisontell genöverföring användes för att förklara observationen att
generna har överförts mellan Archaea och Thermotoga förfäder efter att
Thermotoga förgrenades från andra bakterier
19
20
Problem med BLAST-metoden
•
Bästa sekvenslikhet innebär inte nödvändigtvis närmast släkt
Tre exempel på evolutionära händelseförlopp där en BLAST-sökning skulle
visa största sekvenslikhet mellan människa och bakterie
– Endast c har orsakats av en horisontell genöverföring
21
Identifiering av genöverföringar med
fylogenetiska metoder
•
Med fylogenetiska metoder fås
relationerna mellan många
sekvenser samtidigt
•
Mottagaren av en genöverföring
återfinns inuti gruppen som var
givare i överföringen (idealt)
•
Eftersom fylogenetiska metoder
är utvecklade för att återskapa
evolutionära släktskap mellan
sekvenser är de överlägsna t ex
BLAST-sökningar för visa och
motbevisa genöverföringar
22
Glutamat
dehydrogenase
•
Fylogenetiskt träd baserat
på glutamat
dehydrogenase
•
Släktskapen mellan
sekvenserna
överrensstämmer inte
med de förväntade
släktskapen mellan de
inkludera organismerna
– T ex är eukaryoterna och
proteobakterierna
utspridda i många
grupper
23
Problem med fylogenetiska metoder som
identifieringsmetod för genöverföringar
• Fylogenetiska metoderna ej perfekta – risk att dra felaktiga
slutsatser från resultat som baserar sig på systematiska ”fel” i
sekvenserna (t ex GC-halt i genomen)
• Även perfekta träd kräver mycket tolkning av biologen – oftast kan
flera olika evolutionära händelseförlopp vara tänkbara för att förklara
träden
• Svårt att automatisera – för att få fylogenetiska träd av hög kvalitet
kräver arbete från biologisk kunniga forskare
24
Identifiering av genöverföringar med
gendistribution
• På senare tid har allt fler genom från olika stammar av samma art
blivit tillgängliga
• Trots att stammarna har hög sekvenslikhet (som väntat) finns det
oftast en relativt stor del unika gener i vardera stammarna
25
Prochlorococcus
•
Cyanobakterie – den minsta kända fotosyntetiska
syrebildande organismen (diameter: 0,6 µm)
•
Dominerande plankton (i antal) i tropiska hav
•
Två stammar sekvenserade: MED4 och MIT9313
•
De har 1716 respektive 2275 gener, varav 1350
finns i båda stammarna
26
Evolution av genomen hos Prochlorococcus
•
Kryssen visar positionen
för orfologa gener
– Omorganisationer
symmetriska runt oriC
•
Kryssen på axlarna visar
positionen för unika gener
för stammen
– De är fördelade över hela
genomet
27
Exempel på skillnader i genomen hos
Prochlorococcus
• Introduktion av gener involverade i syntes och transport av
kolhydrater i MIT9313-genomet via horisontell genöverföring
28
De två stammarna av Prochlorococcus är
optimerade för olika miljöer
•
De två stammarna
har olika
djupoptimum i havet
•
Skillnaderna i
genomen återspeglar
antagligen de olika
förutsättningarna i de
olika miljöerna
29
Escherichia coli – en art?
•
Escherichia coli återfinns i tarmen hos djur och människor, men kan också leva
fritt utanför djuren
– Oftast är den ofarlig för värden, men vissa stammar är patogena med allvarliga följder
(t ex EHEC)
•
Jämförelse mellan tre stammar av E. coli; K-12 (labstam), CFT073 som orsakar
urinvägsinfektion, och O157:H7 som orsakat ”hamburger disease” i USA visar att
de skiljer sig väldigt mycket, antagligen p g a mycket genöverföringar
•
Genomet av en stam av
E. coli inte tillräcklig för att
beskriva ”E. colis genom”
30
Problem med gendistribution som
identifieringsmetod
• Omöjligt att veta om en enskild gen som är unik för en stam har tagit
upp av denna, eller om genen förlorats i den andra stammen
– Ju fler närbesläktade stammar/arter, desto mindre problem
31
Mönster av genöverföringar
”Complexity hypothesis”
•
Gener som kodar för metaboliska proteiner med få interaktioner med andra
komponenter i cellen genomgår horisontell genöverföring relativt ofta
•
Gener som kodar för proteiner med många interaktioner med andra
proteiner i cellen, t ex i translation- och transkriptionmaskinerierna, överförs
mer sällan
•
Detta kan förklaras med att proteiner med få interaktioner är lätt utbytbara,
medan proteiner med många interaktioner har evolverat tillsammans med
proteinerna de interagerar med och därför är svårare att byta ut
32
Mönster av genöverföringar
• Gener överförs från arter som finns i närmiljön
– Arter som lever tillsammans med många andra prokaryoter överför
gener i stor utsträckning
– Intracellulära parasiter och symbionter kommer i kontakt med få andra
prokaryoter – de påverkas därför litet av genöverföringar
33
Innehållet i genomet hos mikroorganismer består
av en stabil kärna med ett variabelt hölje
•
Hastigheten för den horisontella överföringarna varierar stort för olika typer av
gener
– Vissa gener är väldigt svåra att byta ut och är därför lämpliga att använda som
fylogenetiska markörer (proteiner med många interaktioner)
– Andra gener byts ut med relativt hög frekvens och är olämpliga att använda som
markörer för släktskap mellan organismer
•
Vad är en ”art” av en mikroorganism?
34
Evolutionen av mikroorganismer kanske
bättre representeras av ett nät än ett träd
Tidigare modell
Modell som tar med kunskapen
från jämförande genomik
35