Geneticko-genealogičtí evangelisté. Povídání s administrátory facebookové skupiny, která je středobodem české komunity

Martin Kotačka, Jakub Krchák a Michal Pilař (profily na posledním listu tohoto článku) patří ke správcům facebookové skupiny Genetická genealogie, která je tuzemským středobodem geneticko-genealogické komunity. Najdete v ní cenné rady pro úplné začátečníky a stejně tak vám zde rádi pomohou s dalším využitím výsledků DNA testů. Každý měsíc tady navíc probíhá pravidelný monitoring počtu otestovaných uživatelů, který dává tušit neopadající zájem o DNA testování v Česku.

Rozmach genetické genealogie. Najděte si nového bratrance, je to jednodušší, než kdy dřív

Pánové, jak jste se ke genetické genealogii dostali? Doplnila u vás genetika klasickou genealogii, nebo tomu bylo naopak?

MK: V roce 2007 se ke mně dostala nabídka genealogického testu, tehdy ještě z našeho dnešního pohledu velmi primitivního a málo podrobného, přesto jsem ji hned s nadšením využil, protože v mé rodinné genealogii, na které jsem tu dobu už několik let pracoval, se vyskytlo několik důležitých otázek, které nešlo jinak než s pomocí genetiky zodpovědět.

MP: V genealogické skupině na diskusním serveru Okoun se před lety občas někdo začal bavit o genetických testech. Zaujalo mě to, a když mi Martin K. nabídl možnost zúčastnit se projektu Genetika a příjmení, neváhal jsem. Po necelém roce byl výsledek.

Genetické platformy lákají i na určení vaší etnicity – pro Evropany a speciálně Čechy jde ale o irelevantní výsledky. Smysl mají například ve Spojených státech, kde lidí často netuší, odkud jejich předkové přišli

JK: Genealogii jsem se i díky dědečkovi věnoval od mlada, navíc mě bavily i další vědní obory, mezi nimi genetika. I proto jsem bedlivě sledoval pokrok v oblasti haploidních markerů, čtení lidského genomu, a především snižování cen a zvyšování dostupnosti testů. Do kolotoče genetické genealogie jsem naskočil autozomálním testem v roce 2014.

Když začnu se svými blízkými mluvit o DNA testování, často se setkávám s odmítáním a obavami z možné zneužitelnosti. Je strach relevantní?

MK: Zneužitelnost u tohoto druhu testování je prakticky nulová. Rozsah testování je sice vhodný pro genealogické účely, nicméně nikoli pro využití v jiných oborech. Navíc komerční laboratoře testují odběr jako anonymní pod unikátním kódem . Kdo se pod tím skrývá, nemohou vědět a ani to není v jejich zájmu. Navíc pracují v oblasti, kde je stěžejní důvěryhodnost. Vědí, že kdyby ji jakkoli poškodili, odrazí se to na jejich byznysu. Nebo rovnou skončí.

Jsem Evropan, trochu Nigerijec a Eskymák. Dorazily výsledky DNA testu MyHeritage

JK: Koncept zneužitelnosti je většinou dán nedostatečným pochopením základních faktů a také špatnou žurnalistikou sahající po křiklavých titulcích bez souvislostí a často i faktů.

Výsledky testu lze nahrát i do databází dalších služeb, potenciál k nalezení dalších shod se tím výrazně zvýší

Předně panuje mezi lidmi miskoncepce o (ne)dostupnosti jejich DNA. Naši DNA trousíme, kudy chodíme: když něco hodíme do popelnice, napijeme se ze sklenice, na našem použitém oblečení. Kdyby někdo chtěl naši DNA získat, nebude s tím mít nejmenší problém.

Dalším důležitým parametrem je rozsah čtené genetické informace. Každý autozomální test využívá jen zlomek lidské DNA: 1 až 2 promile. To je dost zajímavé z hlediska genetické genealogie, ale zcela eliminuje obavy ze zneužitelnosti.

Máte nějaký recept, jak potenciální testované k odběru přesvědčovat?

MK: Nejlepší obranou proti strachu je zeptat se dotyčného, jakého konkrétního možného zneužití se bojí. Většinou nakonec zjistíme, že vlastně vůbec netuší, jak by se něco takového dalo konkrétně zneužít.

JK: Zároveň je ale nutností testovaného poučit o tom, co vše se může stát – primární a největší riziko je zjištění, že v blízké rodině něco není v pořádku (například, že něčí rodič není ten, kdo jsme si mysleli). Proto se všech testovaných dopředu ptám, zda jsou připraveni na případná překvapení či rodové nesouvislosti, abych pak nemusel řešit tato dilemata. Druhou, mnohem obskurnější, možností je využití výsledků v databázi policií po obzvláště závažných zločinech. K tomu však dnes dochází především v USA, a vždy až na základě soudního rozhodnutí. Navíc se to děje jen v určitých databázích (např. 23andMe a Ancestry pro tento účel svou databázi nikdy neposkytly) a/nebo jen s explicitním souhlasem (GEDmatch).

Pomocí nástrojů, jako je Gedmatch, lze porovnávat výsledky z mnoha testovacích nástrojů. I díky tomu můžu prozkoumat shodné segmenty DNA v testech z MyHeritage a 23andMe

Důležitou roli v přesvědčování hrají přínosy testu DNA: spojování rodiny komunikací okolo společných předků a společné DNA, zachování dědictví dalším generacím či vyřešení rodinných záhad. Určitě je dobré využít jako motivaci již dosažené úspěchy v rodokmenu.

Kolik rodinných příslušníků máte otestováno?

MK: Otestovaných mám přibližně třicet lidí z bližší i širší rodiny. Nikdo z nich neměl s testováním takový problém, že by odmítnul. Jejich zvědavost, jakou máme prehistorii a původ, byla vždy veliká.

MP: U mě je to asi 26 lidí z blízké i vzdálenější rodiny a další dva testy jsou na cestě. Naštěstí nebyl větší problém s tím, že by někdo odmítal, spíš se někdo i radoval, že už na něj přišla také řada.

JK: Já jsem otestoval vyšší desítky příbuzných. Někteří, typicky právě v nejstarší žijící generaci, testování odmítli. Je důležité pro integritu genealogů a genetické genealogie takové přání respektovat.

Migrační trasy jednotlivých haploskupin od nejstaršího společného předka. Ten je jako Y-DNA Adam označen hvězdičkou ve středozápadní Africe

Pokud tuto nejstarší žijící generaci nestihneme otestovat běžným způsobem, kdy se odběr provádí ze slin, lze DNA získat například z vlasů již nežijícího předka?

MK: DNA lze získat víceméně z každé součásti lidského těla. Vlasy jsou však trochu výjimkou, neboť u nich se DNA nachází v jejich kořínku. Pokud se však na vlasech zachoval kožní maz, pak z něj je analýza DNA možná. Některé laboratoře dnes nabízejí analýzu z netradičních materiálů, jako jsou právě vlasy nebo třeba z pod známek dopisů (tedy zejména chceme-li analyzovat DNA lidí, kteří již nežijí), nicméně jejich úspěšnost a kvalita výsledků je často diskutabilní.

Pokud tedy máme něco po dědečkovi, pak si to raději uschovejme a počkejme ještě pár let. Technologie jdou dopředu závratnou rychlostí a s nimi i jejich citlivost a kvalita produkovaných dat. Tady se vyplatí být trochu trpělivý.

Co se s běžně odebraným vzorkem děje po jeho přijetí do laboratoří a co surová data po analýze obsahují?

MP: Vzorek (buď na štětečku z úst nebo ve slinách) je nejprve v laboratoři zpracován – je izolována DNA a vyčištěna od nežádoucích příměsí (ač se to nezdá, žijí v nás např. spousty bakterií, jejichž genetickou informaci zjišťovat nechceme). Upravená pak jde do zpracování: k tomu se u autozomálního testu používá tzv. DNA čip (u Y-DNA a mtDNA je využívána jiná technologie). Extrahovaný vzorek se umístí na speciální destičku a vloží do testovacího přístroje, kde se vzorků zpracovává mnoho naráz.

Následně dochází k reakci, při níž lze detekovat, jaká písmena jsou na několika statisících sledovaných míst DNA. Výsledkem je potom dlouhý soupis asi 700 tisíc pozic na chromozomech DNA, kdy každá pozice obsahuje dvě písmena DNA: jedno z chromozomu od otce, druhé od matky (test přitom neví, které je od koho). Různé DNA čipy nemusejí využívat stejná místa DNA – každá z testovacích společností má totiž trochu jinou sadu míst, která čte. Naštěstí pro nás mají ale většinou dostatečně velký průnik, takže lze výsledky dobře porovnávat mezi sebou.

Takto vypadá noční můra každého genetického genealoga: výrazná shoda od neznámého uživatele bez rodokmenu, který neodpovídá na dotazy a svoje výsledky nemá ani na dalších testovacích platformách

Nyní máme velké množství surových dat, jak ale vypadá následná interpretace, při níž získáme především shody DNA?

MP: DNA je složena pouze ze 4 písmen (A, C, G, T: adenin, cytosin, guanin a thymin) a aby se dalo odlišit, že je nějaký úsek opravdu DNA shoda, a nejen náhodně stejný kus DNA, je potřeba, aby ten společný kus byl dost velký. Velikost společného úseku se udává v centimorganech (cM) a uvádí se, že segment dlouhý 7 cM je až v půlce případů náhodně shodný. Proto společnosti menší kusy než těch 7 cM většinou ignorují a počítají s těmi většími. Tam pravděpodobnost, že jde o náhodu, rychle klesá. A to samé děláme i my při zkoumání shod – jdeme od těch největších shod, které jsou genealogicky nejnadějnější a lze u nich někdy dohledat společného předka v matriční době.

V čase se nám ale mohou tyto výsledky v databázích mírně měnit. Čím jsou tyto úpravy způsobeny?

MP: Čtení DNA není stoprocentně spolehlivé a ve velmi malém procentu z celkového objemu dochází k chybám ve čtení. U autozomálního testu vstupuje do hry i již zmíněný fakt, že společnosti netestují stejná místa. Čipy jsou navíc v průběhu upravovány a například aktuální čip u FTDNA čte z nemalé části jiná místa než čip používaný před čtyřmi lety.

Největší revoluce od zavedení otisků prstů. K nalezení pachatele stačí DNA jeho vzdáleného bratrance

Porovnávat pak data ze všech těch verzí čipů mezi sebou je velmi náročný úkol, s nímž výrazně zápasí i samotné společnosti. Firma MyHeritage zatím zůstává, co se týká spolehlivosti uvedeného porovnávání, bohužel daleko na chvostu všech společností působících v tomto oboru, její výsledky jsou nejméně konzistentní a vykazují nejvíce problémů.

Dá se tedy říct, že některé z dostupných služeb mají přesnější výsledky než zbytek?

MK: Zde je potřeba se na to dívat ze dvou pohledů. Například v případě analýzy mužské linie, tedy chromozomu Y, je nutné sledovat, jak podrobnou analýzu společnost nabízí. Tedy kolik markerů analyzuje a jaké konkrétní markery to jsou. V případě autozomálního testu je to trochu jiné. Kvalita těch dat je víceméně srovnatelná, resp. jejich rozsah je pro genetickou genealogii dostačující. U těchto dat je složitějším oříškem ona interpretace. Tady už se dostáváme do oblasti bioinformatiky a schopnosti ty statisíce a miliony písmenek nějak smysluplně uchopit a srovnat.

Některé společnosti to umí lépe a jiné o něco hůře. Nicméně vzhledem k tomu, že lze získaný výsledek v mnoha případech nahrávat do databází jiných firem, lze tedy využít i jejich interpretace v jejich vlastní databázi, ačkoli jsme u nich přímo fyzicky test nepodstoupili. Můžeme tak tedy nejen využít shod navíc, ale právě si i jejich kvalitu interpretace ověřit a porovnat. Opět platí, že člověk každopádně nijak neprodělá, když svůj autozomální test nechá udělat u některé z výše uvedených doporučených společností.

Zatím jsme se bavili primárně o autozomálních testech, které jsou nejlevnější. Proč jsou testy Y-DNA a mtDNA o tolik dražší?

MP: Technicky jde o zcela odlišný druh testu s rozdílným postupem a rozsahem. Svou roli hraje i hromadné zpracování – autozomální testy jsou prováděny paralelně ve velkém množství, což celý proces výrazně zlevňuje. Také do toho vstupuje konkurenční tlak, který tlačí cenu autozomálních testů dolů.

Hlavně u testů chromozomu Y mluvíme o genetických markerech. O co se jedná?

MP: Obecně je genetický marker určitá sekvence, kousek DNA, který je jednoduše identifikovatelný, a kde umíme popsat změnu oproti nějakému vzoru. V genetické genealogii používáme dva. STR (Short Tandem Repeat) a SNP (Single Nucleotide Polymorphism).

Objednal jsem si genealogický test DNA. Zajímá mě, jak pomůže při tvorbě rodokmenu

U STR sledujeme počty opakování určitých repetitivních sekvencí v určitých místech DNA. Například test Y-37 u FTDNA zjišťuje 37 takovýchto míst a u každého řekne kolik opakování určitých sekvencí nukleotidů tam testovaná osoba má. Chromozom Y se předává z otce na syna nezměněný, ale občas tam k náhodné malé změně dojít může, a tou může být právě i to, že někde ubyde či přibyde opakování nějaké sledované sekvence. Potomci daného muže v mužské linii si pak tyto změny nesou dál. Z výsledku potom lze statisticky odhadnout, v jaké části stromu mužského pokolení testovaný je.

Pro genealogii se využívá asi 1 až 2 promile lidské DNA. Zneužití k jiným účelům je tak vyloučeno

U SNP jde o změnu jednoho konkrétního nukleotidu – písmenka DNA – v určitém místě na jiné. Opět platí, že se změna dědí dál na syna. Těch míst, kde může ke změně dojít, je mnoho milionů. Díky tomu, že se dědí na syny, lze pak z nich vystavět strom mužského pokolení a určit, která mužská linie se vydělila kde (podle toho, jakou sadu SNP má kdo společnou). Zjistit všechny SNP znamená přečíst co možná nejkompletněji celý chromozom Y. Takový test je potom výrazně náročnější a dražší než STR testy. Výsledkem je však přesné zařazení do stromu, nikoli jen statisticky hrubý odhad jako u STR.

Z kombinace těchto markerů nám potom vzejde haplotyp…

MP: U SNP haplotypu lidé se stejným haplotypem sdílí společného předka v mužské větvi časově blíže, než ho sdílí s ostatními, kde se haplotyp liší. U Y-STR to říci jistě nelze, protože počty opakování se často mění. Může se stát, že vzdálený předek měl třeba 12 opakování, jeho potomek už jen 11, ale v nějakém dalším potomkovi se počet vrátil zpět na 12.

Tím se ztratila informace o celém období, kdy měli opakování jen 11. U SNP se to stát může také (změna písmenka v nějakém místě zpět na původní), ale mnohem vzácněji, navíc tam máme o několik řádů více dat, více sledovaných míst, takže jedno takové SNP, jež se vrátilo na předchozí hodnotu, nehraje tolik roli.

A skupiny haplotypů potom tvoří haploskupiny.

MP: Haploskupiny značíme velkými písmeny (R, I, J atd.), to jsou skupiny haplotypů, které sdílí společné předky daleko v minulosti. V rámci každé z nich pak můžeme haplotypy dále dělit, a to podle společných mutací (u SNP). Nižší haploskupiny pak nazýváme písmenem hlavní haploskupiny (třeba R), následovaným pomlčkou a označením mutace, kterou všechny ty haplotypy sdílí a která v jiných skupinách není. Například haploskupina R-DF27 sdružuje muže, kteří sdílí společného předka, který v místě chromozomu Y označeném DF27 měl najednou místo písmena G písmeno A. Všichni potomci tohoto muže v čistě mužských liniích pak toto A dědili dalších cca 4 500 let.

MK: Díky sledování těchto mutací potom můžeme geograficky znázornit i putování našich předků v otcovské linii. Slouží k tomu tzv. SNP tracker, který jednoduše říká, že se vaši předkové v konkrétní historické době nacházeli na konkrétním místě.

Třetím, v laické genetické genealogii nejméně využívaným testem, je mtDNA. Má vůbec v genealogii vzhledem k nízkému časovému rozlišení smysl?

MK: Pro poznání prehistorie rodu může být jistě zajímavý. Pro řešení nějakých genealogických záhad, otázek anebo problémů však moc významný není. Nicméně nesmíme zapomínat na to, že naše výsledky nepomáhají jen našemu vlastnímu zájmu a naší vlastní rodině, nýbrž jsou i součástí širšího vědeckého poznání minulosti lidstva. Tedy s každou takovou analýzou věnujeme malý dílek do stále podrobnějšího obrazu naší lidské minulosti.

Pokud zvolíte podrobnější test chromozomu Y, dozvíte se, jak putovali vaši předkové z otcovské linie, než se ze střední Afriky dostali až do střední Evropy

MP: Dobře umí například vyloučit, že jsou dvě osoby příbuzné v čistě mateřské linii v posledních stovkách let. Což se může hodit i v genealogii, ale asi dost vzácně. S potvrzením příbuznosti v této linii už je to horší, nejde tam většinou dobře rozlišit, zda mají dvě osoby se stejnou mtDNA společnou pramáti před dvěma stovkami let či před dvěma tisíci let, což je v genealogii samozřejmě problém.

A teď k dalším nabízeným službám, které společnosti zaměřující se na DNA testování nabízí. Lákadlem mnoha z nich jsou i různé zdravotní reporty, u kterých nabízí vše od vypočtení náchylnosti k dědičným chorobám přes výživové rady až po predispozice ke konkrétním sportům. Nejde spíše o věštění z křišťálové koule postavené na velmi hrubé statistice?

MK: Přesně tak. Je jen velmi málo vámi vyjmenovaných záležitostí, které lze spolehlivě a jednoznačně identifikovat nějakou jednou či pár genetickými mutacemi. Většinou je realita mnohem více komplikovaná, kdy jde o souhru a kombinaci mnoha různých faktorů. Samozřejmě nejen genetických. Jakou máte barvu očí, to lze určit celkem spolehlivě. Ale zda ve 62 letech dostanete rakovinu prostaty, to skutečně určit neumíme. Navíc ta data pro statistiku jsou stále ještě velmi malá, a hlavně často vůbec nevíme, kde vlohy pro různé choroby a jiné predispozice vlastně hledat.

Jak sestavit rodokmen. Z informací, které jsou na internetu

A konečně, něco sice stanovit umíme, ale k tomu mnohdy nepotřebujeme genetickou analýzu. Já se díky takovému zdravotnímu reportu dozvěděl, že mám predispozice k diabetu. Navíc vzhledem k tomu, že je diabetes dnes sledovaný v rámci běžných preventivních zdravotních prohlídek a zdravou životosprávu by měl z principu dodržovat každý, nepotřebuji test, neboť dávno vím, že cukrovku měl můj pradědeček, má ji můj dědeček a moje maminka, tedy s velkou pravděpodobností ji budu mít v pozdějším věku také.

V případě genealogie ale výsledky testů zkrátka nelžou a často otevírají rodinné Pandořiny skříňky. Máte zkušenosti s případy, kdy lidé odmítají testování právě kvůli potenciálnímu odhalení například nemanželských potomků? Nebo dokonce s případy, kdy se tak nic netuše stalo?

MP: Ve facebookové skupině Genetické genealogie jsme už několik případů, kdy lidé zjistili z testů, že v jejich blízké rodině něco nepasuje, potkali. A osobně jsem už také jeden případ, ne tedy v blízké rodině, měl. Je potřeba být na to předem připravený, a hlavně nebrat to tragicky. To, že někdo zjistí, že třeba jeho děda nebyl jeho biologický děda, je jenom jeden střípek do mozaiky poznávání vlastní historie. Navíc ani test nezmění to, zda nás nebiologický děda měl rád a my jeho. Pro genealoga to ale nemusí být příjemná zpráva – velká část rodokmenu totiž nebude pokrevně správně.

Testujte a sdílejte. Výsledky vašeho testu sdílené s ostatními pomohou vám i dalším uživatelům při hledání nových shod

Test by měl být vždy dělaný dobrovolně a po zvážení i takovýchto rizik. Někdy to asi může nadělat v rodinných vztazích paseku. Pokud takovou skutečnost zjistím, je pak na zvážení, jak s ní v rodině naložit.

MK: Někteří lidé sice odmítají podstoupit genetický test, ale domnívám se, že většina má jen obyčejný nezájem anebo iracionální obavy z jakéhosi nespecifikovaného zneužití. Takový je můj dojem z dlouhodobého aktivního oslovování veřejnosti při popularizaci genetické genealogie. Pokud by snad mezi nimi byl skutečně někdo, kdo ví o svém hříchu mládí, nechá si tento důvod odmítnutí jistě pro sebe.

Nakonec ale něco pozitivnějšího. Víte o případech z Česka, kdy došlo k nalezení opravdu blízké rodiny, typicky násilně rozdělených sourozenců?

MK: Případů nalezení vzdálenějších či přímo velmi blízkých příbuzných existuje mezi genetickými genealogy celá řada. Nedávno jsem na setkání jedné rodiny, které jsem pomáhal s testováním, potkal člověka, jenž právě díky genetickému testu objevil neznámého otce svého dědečka a s ním i jednu velkou a velmi sympatickou rodinu, která jej nadšeně přijala mezi sebe. Někdy jde o očekávané překvapení, jindy zcela nečekané. Každopádně pro člověka, který si pořídil genetický test, je to vždy velmi radostná událost. Ostatně i proto genetickou genealogii děláme.

MyHeritage nabízí zjednodušený prohlížeč shod na jednotlivých chromozomech – čím je sdílený segment delší, tím je shoda jistější

MP: Co si vzpomínám, třeba v naší facebookové skupině už takový případ v hodně blízké rodině máme. Paní neznala svého biologického otce a testem našla jeho sourozence ve Španělsku, kde si dělali DNA test už dříve. Ti věděli, že mají někde příbuznou, ale nevěděli, kde ji hledat. V mé rodině jsem zatím geneticky nejbližší příbuzné našel v USA – potomky tety mého dědy, o kterých už naše část rodiny vůbec netušila.

Martin Kotačka

Ředitel Archivu Vysokého učení technického v Brně
Vystudoval pomocné vědy historické a archivnictví na Masarykově univerzitě
Podniká v oboru genealogie a věnuje se popularizaci genetické genealogie
Je spolupracovníkem projektu Genetika a příjmení na Kriminalistickém ústavu v Praze

Jakub Krchák

Český podnikatel v oblasti umělé inteligence
Spoluzakladatel technologické skupiny Themama.ai věnující se praktickému užití AI v byznysu
Výkonný ředitel startupu Telma.ai
Dlouhé roky působil v pozici manažera v R&D laboratoři IBM Watson

Michal Pilař

Programátor na volné noze a spoluautor multimediálnáho software MediaMonkey
Absolvent magisterského studia informatiky na MFF UK
Amatérský nadšenec do genealogie, genetické genealogie a focení