Koalescence, fylogeografie, mtDNA
DNA sekvence a populace
čas
Koalescence�„splynutí“ současných linií v MRCA�Most Recent Common Ancestor
Lineage sorting�přežije jen jedna linie�(většinou náhodou)�
Sekvence však nejsou identické díky mutacím!
Přetrvání ancestrálního polymorfismu �(species tree ≠ gene tree)
6
Chr 19
Koalescence
8
Genealogie = rodokmen
9
Mitochondriální Eva
Pozor!
Gene tree
Haplotype tree
MRCA
Nezakořeněné stromy,�Haplotype network, síť haplotypů (často nevíme, co bylo dřív)
Toto jsou sice stromy, �ale bežně se jim říká sítě.
Konkrétní zjištěný haplotyp�Velikost kroužku = počet jedinců s tímto haplotypem
Předpokládaný�nikoliv však pozorovaný�haplotyp
Tradiční představy o mtDNA
mtDNA člověka�Pakendorf & Stoneking 2005
Prvotní přístup
Geomys pinetis (pytlonoš) Avise et al. 1979�
maximum parsimony network
Možné výsledky fylogeografických studií�Extrémní výsledky!�(Avise 2000)
The Hottentot golden mole �(Amblysomus hottentotus)
Mynhardt et al. 2015
○ western □ eastern
Anguilla rostrata
Náhodná disperze larev
Panmiktické agregace �během tření
Expanze a bottleneck
Situace při expanzi
Modely expanze:
Skutečné �bakterie
Surfing
Surfing a sektory - důsledky
Streicher et al. 2016
Micrurus fulvius complex
Korálovec žlutavý
Refugium, Bufo calamita Beebe & Rowe 2000�
Sekvence – ukazatele diversity
GAACGGGATGAACCGTATACCCCCCACTGGCTGGCAATCTGGCCCATGCA
GAACAGGATGAACAGTATACCCCCCCTTGGCTGGCAACCTGGCCCATGCA
GGCTGGCAAT
AGCCGGAAAC
Sekvence – ukazatele diversity
Detekce demografických událostí
Recentní expanze (po bottlenecku)�
Cricetus cricetus �Neumann et al. 2005
Mismatch distribution�párová srovnání sekvencí → histogram
Divergence (%)
Divergence (%)
Divergence (%)
Frekvence
Frekvence
Frekvence
Sekvence navzájem velmi podobné
Sekvence navzájem velmi odlišné
Směs podobných a odlišných sekvencí
Mismatch distribution
Veškerá možná párová srovnání �sekvencí
→ histogram
Divergence (%)
Frekvence
Chen caerulescens
Bimodální MD
Hnízdí vysoko na severu
Kolonizace z více míst
Divergence (%)
Frekvence
Expanze a Mismatch distribution
Sekvence navzájem velmi podobné
Clethrionomys glareolus�Deffontaine et al. 2005
„star pattern“ v síti haplotypů
MD bell-shaped distribution
→ expanze
Demografické změny�Alternativní přístupy
1 segregující místo�párová srovnání:�3x rozdíl, 3x shoda
1 segregující místo�párová srovnání:�4x rozdíl, 2x shoda
Nested clades analysis�Alan R. Templeton�
Lacerta schreiberi �Paulo et al. 2002
Předpoklady !
„Čtení stromů“ a Nested clades analysis�simulace → false-positives (>75 %) �
Petit 2008
Lokální (náhodné) procesy → zdánlivé expanze…
„Coalescent“�Koalescenční teorie
Assumptions
45
Pravděpodobnost koalescence �v předchozí generaci 1/N
mtDNA
Čas k MCRA ~4Ne generací
47
Geometric distribution
Waiting time – čas ke splynutí linií (coalescent event)
Koalescence o dvě generace dřív:
A dále…
Předchozí generace
48
Geometric distribution
Exponential distribution
Mean time to coalescence (of a pair of alleles) – 2N (generations)
(All alleles – 4N)
Variance (2N)2 s.d. 2N
Waiting time – čas ke splynutí linií (coalescent event)
mutace
49
Mutace
50
Lze odhadnout frekvenční spektrum mutací!
Neutrální model
Pravděpodobnost koalescence �v předchozí generaci 1/N
mtDNA
jaderný lokus
mtDNA, Chr Y
Jaderné geny
Y a Ne
54
CAGTGAAGTTCCAA� A C
CAGAGAAGTTCCAA�CAGTGAACTTCCAA
CAGAGAACTTCCAA�CAGTGAAGTTCCAA
„Coalescent“�Koalescenční teorie
Detaily větvení nás nezajímají�Důležité jsou časy k MRCA
57
K čemu to teda vlastně je dobré?
Data, strom, mutační model
Data, strom, mutační model, parametry
Co můžeme zjistit?
Možnosti
K odhadu MRCA stačí malý vzorek
Pravděpodobnost zachycení MRCA celé populace vzorkem o n jedincích:
(n – 1)/(n + 1)
n = 3 → 0,5
n = 20 → > 0,9
Odhady migrace �(Migrate, Lamarc, BayesAss)
Odhady migrace
Model „Isolation with Migration“
Ghost population
Severská refugia
Bayesian Skyline Plot
Bison priscus bizon pravěký
Odhady z minima jedinců a mnoha genů např. PSMC
The PSMC method can be used to analyze unphased sequence
data from a single diploid individual.