Karl Holm Ekologi och genetik, EBC, UU karl.holm@ ebc.uu.se © Nick Brandt Populationsgenetik Kursens upplägg Föreläsningar 24/4, 27/4, 28/4, 29/4, 4/5, 10:15-16:00 10:15-16:00 10:15-16:00 08:15-12:00 10:15-16:00 12/5, 08:15-09:00 Friessalen ‘’ ‘’ ‘’ ‘’ 13/5, 8.00-13.00 Introduktion, HWE Inavel Genetisk drift Genetisk struktur Selektion Lindahlsalen Frågestund Material (Studentportalen) PDF från föreläsningar, Övningsuppgifter med facit Övningstenta Formelsamling Tenta Populationsgenetik: introduktion VAD? Definition, teoretisk och tillämpad populationsgenetik VARFÖR? Exempel på hur populationsgenetiken kommit till användning HUR? Grundläggande begrepp och en standardmodell för evolution i populationer Vad är populationsgenetik? Läran om populationers genetiska sammansättning och de faktorer som påverkar den över tid. En kvantitativ modell för evolution. I teoretisk populationsgenetik används simuleringar och teoretiska modeller för att bättre förstå hur evolutionära processer påverkar gener i populationer över tid. I tillämpad populationsgenetik används genetiska markörer för att dra slutsatser om populationens struktur, historia, släktskap och selektion, samt för att beskriva geners funktion. Varför populationsgenetik? Modern populationsgenetik har kraftigt påverkats av tre stora omvälvningar inom de biologiska vetenskaperna: Konceptuellt: Betrakta populationer och gener ur ett evolutionärt historiskt perspektiv Empiriskt/datadrivet: 1. Sammanställandet av flera arters “fullständiga” genom. 2. Sekvenseringsteknologi för att upptäcka polymorfier, “markörer”. 3. Tekniker för att snabbt och kostnadseffektivt genotypa* och sekvensera ett stort antal individer. Datorkraft för lagring/hantering/analys av data: En lane Illumina sekvensering generar (idag) 500 millioner fragment av 101 bp längd (50.500.000.000 baser = 17 mänskliga genom) till en kostnad av ca. 12.000 Skr. *sammanställa ett stort antal markörer i en individs genom Nyttan av populationsgenetik? Användningsområden inom olika biologiska forskningsfält: EVOLUTION: studiet av artbildning och naturlig selektion EKOLOGI: information om populationers historia, struktur, spridning och migration NATURVÅRD: skattning av populationers/arters storlek för bevarandet av genetisk variation och livskraft ODLING/AVEL: teori och metodik för att ta fram livskraftiga varianter i olika miljöer MEDICIN: modern teori och metodik för att finna “kandidatgener” för genetiskt nedärvda sjukdomar och hur dessa gener samverkar med andra gener och med miljön Tillämpad populationsgenetik Exempel: Hotade populationer Genetisk variation i den svenska vargpopulationen Övervakning av den svenska vargpopulationen med hjälp av genetiska markörer. Populationen grundas av två vargar. Ytterligare en varg migrerar in. Inavel i den svenska vargpopulationen Inavelskoefficienten (graden av släktskap mellan enskilda individer) uppskattad från släktträd. Standardiserad heterozygositet är ett mått på den genetiska variationen i populationen. Grundläggande begrepp DNA -AGCCTATTTGACG-AGCGTATTTGCCGpolymorfier Gen Den grundläggande fysiska och funktionella enheten av DNA som går i arv, dvs för information vidare från en generation till nästa. Locus (pl. loci) Känd plats i genomet där en gen är lokaliserad. Allel De olika varianter av en gen som kan förekomma vid ett bestämt locus (A och a). Alleler (A och a) A a Locus Heterozygot En diploid individ är heterozygot vid ett locus om allelerna vid detta locus är olika (Aa). Homozygot En diploid individ är homozygot vid ett locus om ... (AA eller aa)? Homologa kromosomer Genotyp Uppsättningen alleler vid ett lokus hos en individ (AA/Aa/aa). Fenotyp Uttryckt form eller variant av en karaktär hos en specifik individ (röd eller blå). Dominant allel En allel som uttrycker sin fenotypiska effekt även om den förekommer heterozygot med en recessiv allel. Recessiv allel En allel vars fenotyp inte uttrycks i en heterozygot. Alleler (röd och blå) A a Lokus för färg Allel (A och a) Homozygot (AA eller aa) Homologa kromosomer Heterozygot (Aa) Genotyp (AA/Aa/aa) Fenotyp (röd/blå) Den centrala doktrinen i molekylärbiologi “the central dogma” Genotypen lagras i DNA och går i arv. Proteinfunktionen påverkar individens fenotyp. Mendelsk nedärvning Egenskaper (fenotyper) nedärvs genom distinkta partiklar (alleler). Gregor Mendel (1822-1884) Alleler förekommer i par (hos diploida individer) där en allel kommer från vardera förälder. Mendels två lagar: 1. Allelerna segregerar slumpmässigt, dvs när haploida könsceller bildas så kan vilken som av de två allelerna hos den heterozygota föräldern ingå i en specifik könscell (gamet). 2. Gener för olika egenskaper (fenotyper) nedärvs oberoende av varandra. Detta gäller bara för icke-länkade gener! Mendelsk nedärvning, exempel: Hur många är allelerna? Vilka är fenotyperna och genotyperna i föräldragenrationen och F1generationen? Vilka proportioner av fenotyperna respektive genotyperna förväntas i F2-generationen? Vilken, om någon, allel är dominant över den andre? Vad kallas denna nedärvning? Kvantitativa egenskaper: många gener som samverkar En gen, två alleler Två gener, två alleler Tre gener, två alleler Kan vi få samma spridning i fenotypen med bara en gen? “Många” gener, två alleler Exempel på fenotyper: längd, blomningstid, fitness/“överlevnad”? Grundläggande evolutionära processer: Varifrån kommer variationen? Mutationer Migration Vart tar den vägen? Drift Inavel Selektion Grundläggande evolutionära processer: Mutationer •Punktmutationer (SNP = single nucleotide polymorphisms) • Genetisk markör En variation (mutation) i DNA-sekvensen av något slag vars plats i genomet vi känner till, antingen definitivt, eller relativt andra markörer. • Typer av genetiska markörer Mikrosatelliter RFLP (restriction enzyme polymorphism) SNPs (punktmutationer) - den idag mest förekommande och använda Några mått på genetisk variation (genetisk diversitet) Heterozygositet (H) antalet heterozygoter H= totala antalet individer Allelisk diversitet (A) A= totala antalet alleler i alla loci antalet loci Frekvensen polymorfa loci (P) P= antalet polymorfa loci totala antalet loci Genetisk diversitet i några olika arter (hotade och ickehotade) Människa Schimpans H 0.81 0.65 A 8.9 7.8 n 28 35 Prärievarg Etiopisk varg 0.68 0.21 5.9 2.4 17 20 Alligator Komodovaran 0.67 0.31 8.3 4 28 78 H = heterozygositet, A = allelisk diversitet, n = sampelstorlek Allelefrekvenser och genotypfrekvenser - vad är det? När vi vill beskriva den genetiska variationen i en population, så räknar vi intuitivt data. Antag ett locus i följande population som består av 10 diploida individer: A1A1 A1A2 A1A2 A1A2 A1A2 Genotyper: A1A1 A 1A 2 A 2A 2 ∑ 4 2 10 A1A1 A1A1 Antal: A2A2 A2A2 Alleler: A1 A2 ∑ Antal 12 8 20 A1A1 4 Hur beräknar vi allel- och genotypfrekvenser? Istället för att använda räknedata från ett specifikt exempel, så kan vi generalisera förhållandet mellan alleler och genotyper med relativa frekvenser (p): A1A1 A1A2 A1A2 A1A2 Genotyper: A1A1 A 1A 2 A 2A 2 ∑ Antal: 4 4 2 10 Notation: X11 X12 X22 1 Relativa frekvenser (genotyper): 0.4 0.4 0.2 1 A1A2 A1A1 A1A1 A2A2 A2A2 A1A1 1. Frekvensdefinition av f 2. Sannolikhetsdefinition av p Den relativa frekvensen av A1-alleler bland alla alleler i populationen: a) Dra slumpmässigt en individ ur populationen b) Dra slumpmässigt en allel från den individen p(A1) = X11 + 1/2 × X12 = 0.4 + 1/2 × 0.4 = 0.6 p(A1) = X11 × 1 + X12 × 1/2 + X22 × 0 = 0.4 × 1 + 0.4 × 1/2 + 0.2 × 0 = 0.6 A 1A 1 A 1A 2 A 2A 2 Varför använder vi dessa frekvenser och hur kan förhållandet mellan dem illustreras? 1. Att räkna med frekvenser “inbjuder” oss att tänka i termer av sannolikheter (de är egentligen samma sak!). Detta har visat sig mycket användbart inom populationsgenetiken. 2. Givet att vissa specifika förhållanden råder i populationen vi studerar, så gäller ett enkelt samband mellan proportionerna av allel- och genotypfrekvenserna i en population: Detta samband kallas Hardy-Weinbergs lag, och det specifika förhållande som måste gälla är att inga evolutionära krafter verkar i populationen. Hardy-Weinbergs lag/jämvikt (HWE) Vad är HWE? En av de mest använda principerna/grundmodellerna inom populationsgenetiken. Används för att identifiera inavel, parningssystem och populationsstruktur i verkliga populationer. Beskriver det förväntade förhållandet mellan genotypfrekvenser och allelfrekvenser i en ideal population. Hardy-Weinbergs lag/jämvikt (HWE) Vad är en ideal population - förutsättningarna för HWE? 1. Slumpmässig parning 2. Oändligt stor populationsstorlek 3. Ingen migration 4. Inga mutationer 5. Ingen selektion Kort sagt: en population där inga evolutionära krafter verkar! Övriga: diploid organism med sexuell reproduktion; icke-överlappande generationer, osv… Hardy-Weinbergs lag/jämvikt (HWE) Alleler: A och a Allelfrekvenser: p + q = 1 Genotyper: AA, Aa, aa Genotypfrekvenser: p2 + 2pq + q2 = 1 Hardy-Weinbergs lag/jämvikt (HWE) Vad händer med allel- och genotypfrekvenser i en HWE population? Allelfrekvenserna förändras inte. Genotypfrekvenserna kan beräknas utifrån allelfrekvenserna. Om vi har ett två-allelslokus, med allel A i frekvensen p och allel a i frekvensen q = 1 - p, då gäller: Genotyper AA Aa aa Förväntade frekvenser p^2 2pq q^2 där allelfrekvenserna: p + q = 1 och genotypfrekvenserna: p2 + 2pq + q2 = 1 HWE och förväntad heterozygotigrad (= genetisk diversitet, He) •HWE: Genotyper Frekvens AA Aa aa p2 + 2pq + q2 =1 •Den totala frekvensen homozygoter (F): k X där k = antalet alleler i lokuset 2 F = pi och pi = allelfrekvensen för allel i i=1 •Analogt, så är förväntad heterozygotigrad den förväntade frekvensen heterozygoter (He) i en population i HWE: He = 1 F =1 k X i=1 p2i jmfr. med observerad heterozygotigrad: H= antalet heterozygoter totala antalet individer Hardy-Weinberg proportioner Vid vilken allelfrekvens är heterozygotigraden maximerad? I vilken genotyp hittar vi lågfrekventa (sällsynta) alleler? Test av Hardy-Weinberg proportioner i en population 1(4) Ett lokus för röda blodkroppar undersöktes hos 1000 engelska blodgivare: Genotyp AA Aa aa Observerat antal Förväntat antal 298 ? 489 ? 213 ? Är populationen i HWE vid detta lokus? Allelfrekvenser vid ett tvåallelslokus: p + q = 1 Förväntade genotypfrekvenser vid HWE: p2 + 2pq + q2 = 1 ∑=1000 ∑=1000 Test av Hardy-Weinberg proportioner i en population 2(4) Är populationen i HWE vid detta lokus? Genotyp AA Aa aa Observerat antal Förväntat antal 298 ? 489 ? 213 ? ∑=1000 ∑=1000 Allelfrekvenser: p + q = 1; förväntade genotypfrekvenser vid HWE: p2 + 2pq + q2 = 1 1. Beräkna allelfrekvenserna: p(A) = frekvens(A) = ((2×298) + 489) / (2 × 1000) = 0.5425 q(a) = 1 - p(A) = 1 - 0.5425 = 0.4575 2. Beräkna föväntade genotypfrekvenser (om population i HWE): Förväntad frekvens (AA) = p2 = 0.54252 = 0.2943 Förväntad frekvens (Aa) = 2pq = 2 × 0.5425 × 0.4575 = 0.4964 Förväntad frekvens (aa) = 1 - (p2 + 2pq) = 0.2093 3. Beräkna föväntat antal från genotypfrekvenserna: Förväntat antal (AA) = p2 × 1000 = 294.3 Förväntat antal (Aa) = 2pq × 1000 = 496.4 Förväntat antal (aa) = q2 × 1000 = 209.3 Test av Hardy-Weinberg proportioner i en population 3(4) Är populationen i HWE vid detta lokus? Genotyp AA Aa aa Observerat antal Förväntat antal 298 294.3 489 496.4 213 209.3 ∑=1000 ∑=1000 Överenstämmelse mellan observerat- och förväntat antal testas med ett X2-test (chi-2) med nollhypotesen H0: Ingen skillnad föreligger mellan observerat och förväntat antal; population i HWE. 2 χ 22 = k X (o e)2 e X2 = teststatistik O = observerat antal e = förväntat antal k = antalet genotypklasser 2 2 2 ( 298 − 294,3) ( 489 − 496,4 ) ( 213 − 209,3) = + + 294,3 496,4 209,3 = 0,22 Test av Hardy-Weinberg proportioner i en population 4(4) Vår beräknade teststatistik för X2 = 0.22 kontrolleras mot tabell: Frihetsgrader = k - 1 - ep ger df = 3 -1 - 1 = 1 k = antalet klasser av data (varav 2 är “fria att variera” av 3) ep = antal parametrar estimerade från data (p) Från tabell: X20.95; 1df = 3.841 0.22 < 3.841, H0 kan inte förkastas, dvs genotypfrekvenserna avviker inte signifikant från HWE proportioner. Populationen befinner sig i HWE. Sammanfattning Populationsgenetiken är den bästa modell vi har för evolutionära processer. Populationsgenetik används för att nå ökad förståelse för evolutionära och demografiska processer. Hardy-Weinbergs lag är en central princip inom populationsgenetiken. Hardy-Weinberg jämvikt: Allelfrekvenser förändras inte över tiden. Allelerna kombineras slumpvis. Genotypfrekvenserna kan beräknas utifrån allelfrekvenserna (p + q = 1): Genotyper AA Aa aa Frekvenser p2 2pq q2