Genstruktur och genom-organisation (vt2010) Det funktionella DNAt är organiserat i gener. DNA som inte har någon känd funktion, sk icke funktionellt DNA. Definition av gen: 1. Region(er) av nukleinsyra (DNA) som behövs för syntesen av en funktionell genprodukt: Polypeptid eller RNA-molekyl (rRNA, tRNA etc. ). 2. Enhet för nedärvning av information från en generation till nästa generation (genetisk definition). Genotyp = En individs exakta genetiska egenskaper. Fenotyp = En organisms hela fysiska skepnad eller en specifik egenskap Det specifika resultatet av att generna är aktiva som ger upphov till en individs egenskaper. Genen innehåller: 1. Regioner som transkriberas. Hos mRNA delas de transkriberade regionerna in i translaterade (cds) och otranslaterade regioner (3’- resp 5’-UTR ”untranslated region”). 2. Regioner som behövs för kontroll och reglering av transkriptionen. Promotorer samt andra regulativa sekvenser ”element”, tex. "enhancers". Gener hos prokaryoter (bakterier): Är kontinuerliga Flera gener transkriberas till samma mRNA (polycistroniskt mRNA) En dylik grupp av gener kallas ett operon och har gemensam reglering. Gener hos eukaryoter: De flesta eukaryota gener har exoner och introner (”split genes”). Sammanfogningen av exoner sker under pre-mRNA processningen under den sk. Splitsningen (”splicing”). En gen transkriberas per mRNA (monocistroniskt mRNA). Enskild gen reglering. Genstorlek i medeltal: 500 bp - 50 000 bp, introner 50-5000 bp (längsta intronet 17106 bp) Har varit/är en evolutionär fördel med att organisera gener i exoner och introner: Multidomän-proteiner , exoner motsvarar ofta proteindomäner eller delar domäner. Organisation i introner/exoner ger ökad möjlighet till evolutionär variation hos gener och deras produkter: Mutationer i gener: Exon ”shuffling” mellan gener, interna exonduplikationer kan snabbt ge ny genfunktion. Ökad möjlighet till individuell genreglering! Flera promotorer. Detta visas av att: Transkription av eukaryota proteinkodande gener ger pftast flera mRNA. Gener som transkriberas till endast ett mRNA: enkla transkriptionsenheter. Gener som transkriberas till flera mRNA: komplexa transkriptionsenheter. Flera mRNA kan skapas genom: • alternativ splitsning (tex ”exon skipping”). • att olika polyA signaler används. • Olika promotorer används 1 Komplexa transkriptionsenheter viktiga för den funktionella mångfalden i däggdjurens genom. DNAt kan delas in i tre huvudkategorier: Gener Repetetivt DNA Oklassificerat DNA. Gener (utan intronerna inräknade 1,8% av vårt genom, med introner c:a 55%): • Proteinkodande singelgener. - Gener ofta i genfamiljer med 2 eller fler, mer eller mindre lika medlemmar (utgör majoriteten av generna i genomet) Ryggradsdjur, 20 – 28 000 gener (H. sapiens c:a 25 000 identifierade gener) Ryggradslösa djur, 10 – 20 000 gener (Caenorhabditis elegans c:a 19 500 identifierade gener) Homologer: genetiska karaktärer med samma ursprung, hos organismer Paraloger resultatet av genduplikationer Ortologer resultatet av artbildningen • Tandemrepeterade gener (fåtal proteininformation, andra info om RNA) Histoner, 45S rRNA, 5S rRNA samt tRNA-gener. Tillgodose snabbt behov av många transkript. (>100kopior av rRNA, 5S RNA, 10-100 av respektive tRNA) (0,3% av genomet) • Pseudogener: gener som ackumulerat mutationer så att de blivit icke-funktionella Repetetivt DNA (c:a 48% av vårt genom): Hög-repetetivt DNA (c:a 6 % av vårt DNA ”simple-sequences”). 5-500bp långa enheter, repeterade ett stort antal gånger (sk. tandem- repetitioner) och som ofta utgör sjok om 100 k bp. Ofta samlat i specifika regioner av genomet; sk. satellit DNA. Dessa sitter ofta i centromer-regionen av kromosomer. Mindre regioner med högrepetetivt DNA kallas mikrosatelliter. Dessa regioner är under ständig förändring och skiljer sig därför åt mellan individer och kan därför användas för DNA-”fingeravtryck” vid tex brottsmål (genetic fingerprinting). Förändras vid replikationen.. Intermediär-repetetivt DNA (c:a 40% av genomet): Mobila DNA-element. Flyttar på sig genom transposition (molekylära parasiter, "Selfish" DNA, ingen känd funktion för värden men har antagligen spelat roll under evolutionen). • Transposoner (Hoppande gener) DNADNA (3% av vårt DNA) • Virala retrotransposoner (8% av vårt DNA, retrovirus ursprung) DNARNADNA • Virala icke-retrotransposoner (c:a 34%) LINES long interspersed elements, 6-7kb. En av de vanligaste kallas L1 (c:a 21% av genomet) 2 SINES short interspersed elements, c:a 300bp. En av de vanligaste kallas Alu och uppvisar likhet med 5S-LRNA som är viktig vid protein sekretion. (c:a 13% av genomet), DNARNADNA Man har sett att Alu repeats skyndar på evolutionens exon shuffling process.. Rekombination mellan lika sekvenser. Oklassificerat DNA, mellanliggande icke funktionellt DNA (resten 25% av vårt DNA, introner medräknade c:a 50%). Hur är generna organiserade i genomet? De flesta djuren är diploida (Diploidi - dubbel kromosomuppsättning i motsatt till haploidi - enkel kromosomuppsättning) (polyploidi) Det icke-funktionella DNAt inkl intronerna dominerar ”längdmässigt”. Totala mängden DNA per haploidt genom = C värdet. C-värdet speglar ej arternas fylogeni eller komplexitet. Förklaras av att mängen icke funktionellt DNA varierar mycket mellan arter = ”C-värdesparadoxen” Genomkartan Det eukaryota genomet är uppdelat på kromosomer som namnges i storleksordning. (Kromosom 1 störst) Antalet kromosomer varierar mellan arter (H. Sapiens 23+XY st). Under celldelningens metafas kan kromosomerna urskiljas. Man kan då se två armar; långa (q) och korta (p) armen. Kromosomerna kan färgas varvid ett bandmönster framträder vilket används vid bestämning av regioner på kromosomerna. Ex. 19q13.3 (kromosom 19, q armen, band 13.3) Fördelningen av gener och andra element på de olika kromosomerna beskrivs av genkartor. Det finns två olika kartor; den fysiska genkartan och den genetiska kartan. Fysisk karta – bygger på sekvensinformation och beskriver i vilket basparsintervall en specifik gensekvens ligger på resp. kromosom (räknas från p-armens ände). Kräver att hela kromosomer är sekvenserade. Genetisk karta – bygger på genetiska data hur gener ärvs tillsammans och beskriver deras relativa lägen till varandra. Positioner beskrivs ofta med hjälp av bandmönsterintervall. Innehåller inte bara gener utan också sjukdomar och andra egenskaper. Ett 50-tal eukaryota genom har sekvensats helt eller delvis: Homo sapiens, Pan troglodytes (Chimp.), Canis familiaris (hund), Mus Musculus (hus mus), Gallus gallus (höna), Danio rerio (zebrafisk), Takifugu rubripes (igelkottfisk), Ciona intestinalis (sjöpung), Anopheles gambiae (mygga), Drosophila melanogaster (banan fluga), Caenorabditis elegans (rundmask), Plasmodium falciparum (malariaparasit) m fl. Många bakteriegenom har sekvenerats (>100 tal) 3 Flera av dessa genom är samlade och tillgängliga med sk. ”Genome Browsers”. Viktigaste resurserna; ENSEMBLE (www.ensemble.org), NCBI (www.ncbi.nlm.nih.gov), UCSC genome bioinformatics (genome.ucsc.edu). Organisationen av DNAt i kärnan Hur kan 1,8 meter DNA få plats i kärnan i en eukaryot cell med diametern <15µm? DNAt ligger upplindat och organiserat. DNA + kärnproteiner = kromatin Viktigaste kärnproteinerna kallas histoner. Histonerna är basiska (rika på positivt laddade aminosyror) och är 5 st: H1, H2A, H2B, H3, H4. Histonsekevensen är mycket konserverad. Histoner ser likadana ut i människa som i växter (i alla eukaryoter). DNAt ligger upplindat på komplex av 8 histoner 2x(H2A, H2B, H3, H4). Histon-oktamerkomplexet tillsammans med DNAt bygger upp nukleosomen. C:a 2 varv DNA per nukleosom (146 bp) med mellanliggande DNA bygger upp sk. 11 nm kromatin som har en pärlbandsstruktur. 11 nm kromatinfibern organiseras med hjälp av Histon H1 till 30 nm kromatin (kallas också solenoid). DNA som ligger packat som 11 nm kromatin kan transkriberas (aktivt kromatin). Det kallas också för dekondenserat (ej tätpackat/luckert) kromatin. DNA som ligger packat som 30 nm kromatin, transkriberas vanligtvis inte (inaktivt kromatin). Det kallas också för sk kondenserat (tätpackat) kromatin. Interfas Tiden mellan celldelningar kallas interfas. Kromosomerna är ej synliga under interfasen. Kromatin som är dekondenserat kallas också eukromatin med 11 nm fiberstruktur. Nukleolen är en del av kärnan med många aktiva gener, dvs mycket dekondenserat kromatin. Bla. så ligger rRNA generna i nukleolen. En mindre del av kromatinat är kondenserat, och bildar 30 nm fiber och detta kallas också för heterokromatin. DNAt i heterokromatin är inaktivt. Interfaskärnan har organisation! Ej spagettikastrull! [OH] Kromtinets struktur kan regleras genom modifiering av histonernas -COOH, -NH3 terminala domäner. Acetylering leder till ökad andel av dekondenserat kromatin (11 nm kromatin). Acetyleringen sker på basiska aminosyrarester i histonproteiner (acetylgrupp CH3COO- ). Acetylering av Lysin-16 i H4 Histon acetylaser (HAT) Methylering på lysiner förhindrar acetyleringen.. sker av methyl-transferaser, ex. H3K9HMT Ubiqutinyleringen påverkar kondenseringen.. ej stabiliteten på histonerna. Histonernas N- och C termini sk ”histonsvansar” – acetylering, methylering, fosforylering och ubiqutinylering histonkoden.. 4 Kromatinbindande proteiner binder svansarna beroende på hur de är modifierade. Ex. HP1 (heterokromatin protein 1) binder methylerat lysin 9 på H3 och hjälper till att kondensera nukleosomerna till 30 nm kromatin. Bromodomänen i flera kromtin bindande protein (ex. i HAT) binder acetylerade svansar Kondensering av en av X-kromosomerna hos däggdjurs-honor => Barr bodies.. Doskompensation – X kromosom inaktiveras till heterokromatin. Startar med en hypo-acetylering av H3 K9 – EPIGENETISK process som påverkar genaktivitet och som ”ärvs” till dottercellerna utan att DNAsekvensen påverkats. Kromatin modifiering. Kromatinet vid celldelning: Vid celldelning sker en ytterligare kompaktering av kromatinet. Det bildas vad som vanligen kallas metafas-kromosomer. Under celldelningen är kromatinet inaktivt. En av faserna under celldelningen kallas metafasen och kromosomerna får då det karakteristiska "kromosom-utseendet" med två armar. Dessa strukturer kallas därför metafas-kromosomer. DNAt är replikerat vid ingången i celldelningen och de 2 identiska kopierna (kromatider) fördelas till var sin dottercell vid celldelningen. Man kan urskilja båda kromatiderna på en metafas kromosom men de sitter ihop i centromeren. Icke-histon kromatinproteiner viktiga för den vidare organisationen av metfas kromosomen ”Protein scaffold” Även DNAt självt hjälper till att bygga upp kromosomerna.. Metafas-kromosomernas utseende kan användas för att leta efter kromosomavvikelser i genomet. En av de vanligaste kromosomavvikelserna är trisomi 21 – en extra kromosom 21. Man färgar kromosomerna (tex. Giemsa färgning) för att urskilja dem. Man kan också studera om delar av kromosomarmar har hamnat fel, sk. kromosom-translokation. Dubbelsträngsbrott och felaktig reparation / rekombination. En jämförelse och avbildning av de förekommande kromosomerna kallas - Karyotyp. Delarna på kromosomerna: Telomerer Centromerer Kromatider 5