Populationsgenetik - UU Studentportalen

Karl Holm
Ekologi
och
genetik,
EBC, UU
karl.holm@
ebc.uu.se
© Nick Brandt
Populationsgenetik
Kursens upplägg
Föreläsningar
24/4,
27/4,
28/4,
29/4,
4/5,
10:15-16:00
10:15-16:00
10:15-16:00
08:15-12:00
10:15-16:00
12/5, 08:15-09:00
Friessalen
‘’ ‘’ ‘’ ‘’ 13/5, 8.00-13.00
Introduktion, HWE
Inavel
Genetisk drift
Genetisk struktur
Selektion
Lindahlsalen Frågestund
Material (Studentportalen)
PDF från föreläsningar,
Övningsuppgifter med facit
Övningstenta
Formelsamling
Tenta
Populationsgenetik: introduktion
VAD?
Definition, teoretisk och tillämpad populationsgenetik
VARFÖR?
Exempel på hur populationsgenetiken kommit till användning
HUR?
Grundläggande begrepp och en standardmodell för evolution i
populationer
Vad är populationsgenetik?
Läran om populationers genetiska sammansättning och de faktorer som
påverkar den över tid.
En kvantitativ modell för evolution.
I teoretisk populationsgenetik
används simuleringar och teoretiska
modeller för att bättre förstå hur
evolutionära processer påverkar
gener i populationer över tid.
I tillämpad populationsgenetik
används genetiska markörer för att dra
slutsatser om populationens struktur,
historia, släktskap och selektion, samt
för att beskriva geners funktion.
Varför populationsgenetik?
Modern populationsgenetik har kraftigt påverkats av tre stora
omvälvningar inom de biologiska vetenskaperna:
Konceptuellt:
Betrakta populationer och gener ur ett evolutionärt historiskt perspektiv
Empiriskt/datadrivet:
1. Sammanställandet av flera arters “fullständiga” genom.
2. Sekvenseringsteknologi för att upptäcka polymorfier, “markörer”.
3. Tekniker för att snabbt och kostnadseffektivt genotypa* och
sekvensera ett stort antal individer.
Datorkraft för lagring/hantering/analys av data:
En lane Illumina sekvensering generar (idag) 500 millioner fragment av
101 bp längd (50.500.000.000 baser = 17 mänskliga genom) till en
kostnad av ca. 12.000 Skr.
*sammanställa ett stort antal markörer i en individs genom
Nyttan av populationsgenetik?
Användningsområden inom olika biologiska forskningsfält:
EVOLUTION: studiet av artbildning och naturlig selektion
EKOLOGI: information om populationers historia,
struktur, spridning och migration
NATURVÅRD: skattning av populationers/arters storlek för
bevarandet av genetisk variation och livskraft
ODLING/AVEL: teori och metodik för att ta fram
livskraftiga varianter i olika miljöer
MEDICIN: modern teori och metodik för att finna
“kandidatgener” för genetiskt nedärvda sjukdomar och hur
dessa gener samverkar med andra gener och med miljön
Tillämpad populationsgenetik
Exempel: Hotade populationer
Genetisk variation i den svenska vargpopulationen
Övervakning av den svenska
vargpopulationen med hjälp av
genetiska markörer.
Populationen
grundas
av två vargar.
Ytterligare
en varg
migrerar in.
Inavel i den svenska vargpopulationen
Inavelskoefficienten (graden av släktskap mellan enskilda individer)
uppskattad från släktträd.
Standardiserad heterozygositet är ett mått på den genetiska
variationen i populationen.
Grundläggande begrepp
DNA
-AGCCTATTTGACG-AGCGTATTTGCCGpolymorfier
Gen
Den grundläggande fysiska och funktionella enheten
av DNA som går i arv, dvs för information vidare från
en generation till nästa.
Locus (pl. loci)
Känd plats i genomet där en
gen är lokaliserad.
Allel
De olika varianter av en gen
som kan förekomma vid ett
bestämt locus (A och a).
Alleler
(A och a)
A
a
Locus
Heterozygot
En diploid individ är heterozygot vid ett locus om allelerna
vid detta locus är olika (Aa).
Homozygot
En diploid individ är homozygot
vid ett locus om ... (AA eller aa)?
Homologa kromosomer
Genotyp
Uppsättningen alleler vid ett lokus
hos en individ (AA/Aa/aa).
Fenotyp
Uttryckt form eller variant av en
karaktär hos en specifik individ (röd
eller blå).
Dominant allel
En allel som uttrycker sin
fenotypiska effekt även om den
förekommer heterozygot med en
recessiv allel.
Recessiv allel
En allel vars fenotyp inte uttrycks i
en heterozygot.
Alleler
(röd och blå)
A
a
Lokus
för färg
Allel (A och a)
Homozygot
(AA eller aa)
Homologa kromosomer
Heterozygot (Aa)
Genotyp (AA/Aa/aa)
Fenotyp (röd/blå)
Den centrala doktrinen i molekylärbiologi
“the central dogma”
Genotypen
lagras i DNA
och går i arv.
Proteinfunktionen
påverkar
individens fenotyp.
Mendelsk nedärvning
Egenskaper (fenotyper) nedärvs genom distinkta
partiklar (alleler).
Gregor Mendel (1822-1884)
Alleler förekommer i par (hos diploida individer) där en
allel kommer från vardera förälder.
Mendels två lagar:
1. Allelerna segregerar slumpmässigt, dvs när haploida könsceller bildas så
kan vilken som av de två allelerna hos den heterozygota föräldern ingå i en
specifik könscell (gamet).
2. Gener för olika egenskaper (fenotyper) nedärvs oberoende av varandra.
Detta gäller bara för icke-länkade gener!
Mendelsk nedärvning, exempel:
Hur många är allelerna?
Vilka är fenotyperna och
genotyperna i föräldragenrationen och F1generationen?
Vilka proportioner av
fenotyperna respektive
genotyperna förväntas i
F2-generationen?
Vilken, om någon, allel
är dominant över den
andre?
Vad kallas denna
nedärvning?
Kvantitativa egenskaper: många gener som samverkar
En gen,
två alleler
Två gener,
två alleler
Tre gener,
två alleler
Kan vi få samma
spridning i fenotypen
med bara en gen?
“Många”
gener,
två alleler
Exempel på fenotyper:
längd,
blomningstid,
fitness/“överlevnad”?
Grundläggande evolutionära processer:
Varifrån kommer variationen?
Mutationer
Migration
Vart tar den vägen?
Drift
Inavel
Selektion
Grundläggande evolutionära processer:
Mutationer
•Punktmutationer (SNP = single nucleotide
polymorphisms)
•
Genetisk markör
En variation (mutation) i DNA-sekvensen av något slag vars plats i genomet vi
känner till, antingen definitivt, eller relativt andra markörer.
•
Typer av genetiska markörer
Mikrosatelliter
RFLP (restriction enzyme polymorphism)
SNPs (punktmutationer) - den idag mest förekommande och använda
Några mått på genetisk variation (genetisk diversitet)
Heterozygositet (H)
antalet heterozygoter
H=
totala antalet individer
Allelisk diversitet (A)
A=
totala antalet alleler i alla loci
antalet loci
Frekvensen polymorfa loci (P)
P=
antalet polymorfa loci
totala antalet loci
Genetisk diversitet i några olika arter (hotade och ickehotade)
Människa
Schimpans
H
0.81
0.65
A
8.9
7.8
n
28
35
Prärievarg
Etiopisk varg
0.68
0.21
5.9
2.4
17
20
Alligator
Komodovaran
0.67
0.31
8.3
4
28
78
H = heterozygositet, A = allelisk diversitet, n = sampelstorlek
Allelefrekvenser och genotypfrekvenser - vad är det?
När vi vill beskriva den genetiska variationen i en population, så räknar vi
intuitivt data.
Antag ett locus i följande population som består av 10 diploida individer:
A1A1
A1A2
A1A2
A1A2
A1A2
Genotyper: A1A1
A 1A 2
A 2A 2
∑
4
2
10
A1A1
A1A1
Antal:
A2A2
A2A2
Alleler:
A1
A2
∑
Antal
12
8
20
A1A1
4
Hur beräknar vi allel- och genotypfrekvenser?
Istället för att använda räknedata från ett specifikt exempel, så kan vi generalisera
förhållandet mellan alleler och genotyper med relativa frekvenser (p):
A1A1
A1A2
A1A2
A1A2
Genotyper:
A1A1
A 1A 2
A 2A 2
∑
Antal:
4
4
2
10
Notation:
X11
X12
X22
1
Relativa
frekvenser
(genotyper):
0.4
0.4
0.2
1
A1A2
A1A1
A1A1
A2A2
A2A2
A1A1
1. Frekvensdefinition av f
2. Sannolikhetsdefinition av p
Den relativa frekvensen av A1-alleler
bland alla alleler i populationen:
a) Dra slumpmässigt en individ ur populationen
b) Dra slumpmässigt en allel från den individen
p(A1) = X11 + 1/2 × X12
= 0.4 + 1/2 × 0.4 = 0.6
p(A1) = X11 × 1 + X12 × 1/2 + X22 × 0
= 0.4 × 1 + 0.4 × 1/2 + 0.2 × 0 = 0.6
A 1A 1
A 1A 2
A 2A 2
Varför använder vi dessa frekvenser och hur kan
förhållandet mellan dem illustreras?
1. Att räkna med frekvenser “inbjuder” oss att tänka i termer av sannolikheter (de är
egentligen samma sak!). Detta har visat sig mycket användbart inom populationsgenetiken.
2. Givet att vissa specifika förhållanden råder i populationen vi studerar, så gäller ett
enkelt samband mellan proportionerna av allel- och genotypfrekvenserna i en population:
Detta samband kallas Hardy-Weinbergs
lag, och det specifika förhållande som måste
gälla är att inga evolutionära krafter verkar i
populationen.
Hardy-Weinbergs lag/jämvikt (HWE)
Vad är HWE?
En av de mest använda principerna/grundmodellerna inom
populationsgenetiken.
Används för att identifiera inavel, parningssystem och populationsstruktur i
verkliga populationer.
Beskriver det förväntade förhållandet mellan genotypfrekvenser och
allelfrekvenser i en ideal population.
Hardy-Weinbergs lag/jämvikt (HWE)
Vad är en ideal population - förutsättningarna för HWE?
1. Slumpmässig parning
2. Oändligt stor populationsstorlek
3. Ingen migration
4. Inga mutationer
5. Ingen selektion
Kort sagt: en population där inga evolutionära krafter verkar!
Övriga: diploid organism med sexuell reproduktion; icke-överlappande
generationer, osv…
Hardy-Weinbergs lag/jämvikt (HWE)
Alleler: A och a
Allelfrekvenser: p + q = 1
Genotyper: AA, Aa, aa
Genotypfrekvenser: p2 + 2pq + q2 = 1
Hardy-Weinbergs lag/jämvikt (HWE)
Vad händer med allel- och genotypfrekvenser i en HWE population?
Allelfrekvenserna förändras inte.
Genotypfrekvenserna kan beräknas utifrån allelfrekvenserna.
Om vi har ett två-allelslokus, med allel A i frekvensen p och allel a i frekvensen
q = 1 - p, då gäller:
Genotyper
AA
Aa
aa
Förväntade frekvenser
p^2
2pq
q^2
där allelfrekvenserna: p + q = 1
och genotypfrekvenserna: p2 + 2pq + q2 = 1
HWE och förväntad heterozygotigrad (= genetisk diversitet, He)
•HWE:
Genotyper
Frekvens
AA Aa aa
p2 + 2pq + q2
=1
•Den totala frekvensen homozygoter (F):
k
X
där k = antalet alleler i lokuset
2
F =
pi
och pi = allelfrekvensen för allel i
i=1
•Analogt, så är förväntad heterozygotigrad den förväntade
frekvensen heterozygoter (He) i en population i HWE:
He = 1
F =1
k
X
i=1
p2i
jmfr. med observerad
heterozygotigrad:
H=
antalet heterozygoter
totala antalet individer
Hardy-Weinberg proportioner
Vid vilken allelfrekvens är heterozygotigraden maximerad?
I vilken genotyp hittar vi lågfrekventa (sällsynta) alleler?
Test av Hardy-Weinberg proportioner i en population 1(4)
Ett lokus för röda blodkroppar undersöktes hos 1000 engelska
blodgivare:
Genotyp
AA
Aa
aa
Observerat antal
Förväntat antal
298
?
489
?
213
?
Är populationen i HWE vid detta lokus?
Allelfrekvenser vid ett tvåallelslokus: p + q = 1
Förväntade genotypfrekvenser vid HWE: p2 + 2pq + q2 = 1
∑=1000
∑=1000
Test av Hardy-Weinberg proportioner i en population 2(4)
Är populationen i HWE vid detta lokus?
Genotyp
AA
Aa
aa
Observerat antal
Förväntat antal
298
?
489
?
213
?
∑=1000
∑=1000
Allelfrekvenser: p + q = 1; förväntade genotypfrekvenser vid HWE: p2 + 2pq + q2 = 1
1. Beräkna allelfrekvenserna:
p(A) = frekvens(A) = ((2×298) + 489) / (2 × 1000) = 0.5425
q(a) = 1 - p(A) = 1 - 0.5425 = 0.4575
2. Beräkna föväntade genotypfrekvenser (om population i HWE):
Förväntad frekvens (AA) = p2 = 0.54252 = 0.2943
Förväntad frekvens (Aa) = 2pq = 2 × 0.5425 × 0.4575 = 0.4964
Förväntad frekvens (aa) = 1 - (p2 + 2pq) = 0.2093
3. Beräkna föväntat antal från genotypfrekvenserna:
Förväntat antal (AA) = p2 × 1000 = 294.3
Förväntat antal (Aa) = 2pq × 1000 = 496.4
Förväntat antal (aa) = q2 × 1000 = 209.3
Test av Hardy-Weinberg proportioner i en population 3(4)
Är populationen i HWE vid detta lokus?
Genotyp
AA
Aa
aa
Observerat antal
Förväntat antal
298
294.3
489
496.4
213
209.3
∑=1000
∑=1000
Överenstämmelse mellan observerat- och förväntat antal testas
med ett X2-test (chi-2) med nollhypotesen H0: Ingen skillnad föreligger
mellan observerat och förväntat antal; population i HWE.
2
χ
22
=
k
X
(o
e)2
e
X2 = teststatistik
O = observerat antal
e = förväntat antal
k = antalet genotypklasser
2
2
2
(
298 − 294,3) ( 489 − 496,4 ) ( 213 − 209,3)
=
+
+
294,3
496,4
209,3
= 0,22
Test av Hardy-Weinberg proportioner i en population 4(4)
Vår beräknade teststatistik för X2 = 0.22 kontrolleras mot tabell:
Frihetsgrader = k - 1 - ep
ger df = 3 -1 - 1 = 1
k = antalet klasser av data (varav 2 är “fria
att variera” av 3)
ep = antal parametrar estimerade från data (p)
Från tabell: X20.95; 1df = 3.841
0.22 < 3.841, H0 kan inte förkastas, dvs genotypfrekvenserna
avviker inte signifikant från HWE proportioner.
Populationen befinner sig i HWE.
Sammanfattning
Populationsgenetiken är den bästa modell vi har för evolutionära
processer.
Populationsgenetik används för att nå ökad förståelse för
evolutionära och demografiska processer.
Hardy-Weinbergs lag är en central princip inom populationsgenetiken.
Hardy-Weinberg jämvikt:
Allelfrekvenser förändras inte över tiden.
Allelerna kombineras slumpvis.
Genotypfrekvenserna kan beräknas utifrån allelfrekvenserna (p + q = 1):
Genotyper
AA
Aa
aa
Frekvenser
p2
2pq
q2