Författare Ämne: FTDNA Family Finder (läst 7027 gånger)

Marcus Boman · 2017-03-08, 11:40

Nedan vad jag kan se i mina egna Family-Finder-filer (Matches, Chromosome Browser).

Någon som får fram annat ur sina filer?

------------------------------------------------------------------------------------------------------------------------------------------------------------------

Varje Family-Finder-matchande par måste ha gemensamma autosomala block enligt följande kriterier:

Alternativ 1: Det längsta gemensamma autosomala blocket mätt i centimorgan är större än eller lika med 7,69 men mindre än 9,00, samtidigt är den totala längden av alla gemensamma autosomala block mätt i centimorgan större än eller lika med 20,00.

Alternativ 2: Det längsta gemensamma autosomala blocket mätt i centimorgan är större än eller lika med 9,00.

Annorlunda uttryckt:

Alternativ 1: 7.69 cM<=Longest (Autosomal) Block<9.00 cM & Total Shared (Autosomal) cM>=20 cM.

Alternativ 2: Longest (Autosomal) Block>=9.00 cM.

Gemensamma block på X-kromosomen får man se som extra bonus men alla gemensamma block, autosomala som X-kromosomala, måste ha en längd mätt i centimorgan på minst 1 cM, samtidigt måste längden mätt i antalet markörer vara minst 500.

Annorlunda uttryckt:

CENTIMORGANS>= 1 cM & MATCHING SNPS>=500

Övrigt:
Autosom=kromosom 1-22.
En blocklängd kan mätas i centimorgan men även i antalet markörer.
Det längsta autosomala blocket mätt i centimorgan kallar FTDNA lite slarvigt för "longest block" (borde ha stått "longest autosomal block" eller liknande).
Summan av alla autosomala blocklängder mätt i centimorgan kallar FTDNA lite slarvigt för "shared centimorgans" (borde ha stått något som att det framgår att det rör sig om en totalsumma men att summan bara innefattar autosomerna).

------------------------------------------------------------------------------------------------------------------------------------------------------------------

Som mall använde jag följande blid och kan bara bekräfta den även om det i bilden inte direkt framgår att man utelämnat X-kromosomen.
Bildkälla 1: http://thegeneticgenealogist.com/wp-content/uploads/2016/05/FTDNA_Matching_Algorithm-1.png
Bildkälla 2: http://thegeneticgenealogist.com/2016/05/24/family-tree-dna-updates-matching-thresholds/

Marcus Boman · 2017-03-19, 13:21

Givetvis kan man också mäta längden på ett segment (block) genom att räkna antalet baser (positioner) också.

Så tre olika mått:
Segmentets längd i centiMorgan (cM).
Segmentets längd i antalet SNP-markörer.
Segmentets längd i antalet baser (positioner), oftast uttryckt som megabaser (Mb).

En tumregel verkar vara att 1 cM ungefär motsvarar 1 Mb (se t.ex. https://www.ncbi.nlm.nih.gov/science96/Glossary.html).

Då man oftast inte testar varje bas (position) på segmentet kommer antalet snp-markörer givetvis vara betydligt färre än antalet baser (positioner).

Hans Olof Johansson · 2017-03-21, 12:04

Hej Marcus!

Tack för en klar och överskådlig beskrivning av släktskapsuppskattningen i FTDNA:s Family Finder. Den kan säkert bli till stor nytta för dem som funderar på att göra ett DNA-test eller som nyss gjort ett och nu sitter och funderar på vad resultaten egentligen innebär.

Det enda jag saknar i din framställning är en begriplig förklaring av hur cM (centiMorgan) beräknas och hur detta mått skiljer sig från mera hemtama angivelser av längd eller antal. Det märkliga med cM är ju att den grafiska framställningen i Chromosome Browser, som visar gemensamma segment av varierande längd, inte alls verkar ha något samband med de siffror som beskriver samma segment.

Det vore också intressant att veta hur du ser på tillförlitligheten i de släktskapsuppskattningar som FTDNA gör, där "längden" i cM av det längsta gemensamma segmentet alltså betyder mest. Min uppfattning är att FTDNA:s algoritm är mer eller mindre värdelös när det gäller testpersoner med ursprung här i Norden. Det är dock möjligt att den fungerar bättre för testpersoner i USA, med dess större blandning av människor av vitt skilda ursprung, än för oss som har djupa rötter i något eller några få begränsade områden.

Sedan jag fick mina första testresultat från FTDNA för drygt fyra år sedan, har jag så här långt lyckats identifiera gemensamma anor med 32 av mina nu drygt 1000 träffar (se lista http://www.secutor.se/diverse/32_relatives.pdf ). Jag skulle förmodligen ha kunnat hitta flera om jag hade ansträngt mig lite mera, men efter ett tag uppstår lätt en viss mättnadskänsla - det finns ju så oerhört många 5-10-männingar, och s k pappersforskning är naturligtvis en betydligt effektivare metod att hitta dem, om man nu skulle vilja göra det.

Det mest slående med listan är - tycker jag - hur lite det längsta gemensamma segmentets storlek i cM tycks betyda för identifiering av de närmaste släktingarna bland träffarna. Nästan varje annat mått som jag har haft möjlighet att pröva ger en bättre korrelation med släktskap, och jag tror att det skulle gå att göra en betydligt bättre algoritm än den som FTDNA använder.

Hälsningar
Hans Olof

Marcus Boman · 2017-03-22, 08:33

När det gäller måttet cM.
Ett exempel nedan.
Jag kan ha missat något så var god kontrollera mot läromaterial i genetik eller liknande.

Person A (somatisk cell):

S S
N N
P P
1 2

A C
Kromosom 1 från far: --------|----------------|--------
0000000001111111111222222222233333
1234567890123456789012345678901234

G T
Kromosom 1 från mor: --------|----------------|--------
0000000001111111111222222222233333
1234567890123456789012345678901234

|
|
V

Person A (könscell):

Fyra olika varianter (SNP1-SNP2-kombinationer) av kromosom 1 kan bildas under könscellsproduktionen:

S S
N N
P P
1 2

A C
Variant 1: --------|----------------|--------
(Orekombinerad) 0000000001111111111222222222233333
1234567890123456789012345678901234

A T
Variant 2: --------|----------------|--------
(Rekombinerad) 0000000001111111111222222222233333
1234567890123456789012345678901234

G C
Variant 3: --------|----------------|--------
(Rekombinerad) 0000000001111111111222222222233333
1234567890123456789012345678901234

G T
Variant 4: --------|----------------|--------
(Orekombinerad) 0000000001111111111222222222233333
1234567890123456789012345678901234

Anta att det i detta påhittade exempel finns möjligheten att studera 1000 stycken olika könsceller (1000 stycken 1-kromosomer):

Variant   Antal
1     467
2     28
3     32
4     473
Totalt     1000

Andelen rekombinerade utfall = antalet rekombinerade 1-kromosomer genom totala antalet 1-kromosomer:

(28 + 32) / (467 + 28 + 32 + 473) = 60 / 1000 = 0,06 (6%).

0,06 (6%) motsvarar 0,06 Morgan eller 6 centiMorgan (6 cM).

Det genetiska avståndet mellan SNP1 och SNP2 är 6 cM.

Inte att förväxla med det fysiska avståndet som är avståndet mellan position 9 och position 26 = 17 positioner (segmentet inklusive SNP1 och SNP2 blir då 18 positioner långt).

Om någon av könscellerna från person A parar ihop sig med med en könscell från person B (A och B har motsatta kön) så kan en ny person C bli till.

Mest sannolikt när det gäller arvet från person A till person C är:
A (SNP1) och C (SNP2) eller
G (SNP1) och T (SNP2).
Men som sagt det finns en lite möjlighet att arvet istället blir:
A (SNP1) och T (SNP2) eller
G (SNP1) och C (SNP2).

Marcus Boman · 2017-03-22, 08:56

Hans Olof,

Jag har nog samma bild som du.

FTDNA (och andra aktörer) antar nog att personer har förpersoner (=förfäder/förmödrar) som är totalt oberoende (obesläktade) med varandra, alltså personer med förpersoner som bott i urbana miljöer under lång tid och som kanske flyttat runt en hel del.

Om man vill ange potentiellt släktskap mellan testade personer så måste man utgå ifrån något och enklast är väl då att utgå just ifrån att personer (förpersoner) får (fått) barn med obesläktade.

Jag vet inte hur ett alternativ skulle se ut då graden av släktskap mellan de som skaffar barn tillsammans säkert är väldigt olika över tid och rum.
Låter både tidskrävande och dyrt kanske till och med omöjligt att få fram mer individ-specifika/populations-specifika mallar (algoritmer eller likande).

Men visst ett testföretag skulle ju kunna testa ett hundratal slumpmässigt utvalda i varje land och sedan skapa landsspecifika mallar för hur man uppskattar släktskap mellan individer. Men vad gör man då med amerikaner med en del svenska förpersoner, en del brittiska förpersoner, en del tyska förpersoner, vissa från städer, vissa från landsbygden?

Ett alternativ är givetvis att inte alls uppskatta några släktskap men då tycker nog jag att det är bättre att man gör som nu men mer förklarar att det rör sig om vissa antaganden i grund och botten som kanske inte alls är helt rimliga i vissa fall.

Hellre en enkel modell än ingen modell alls. Bäst är givetvis bättre modeller men det kan nog vara väldigt svårt att få fram. Eller?

Men jag förstår och kan dela din frustration. FTDNA:s släktskapsuppskattningar är kanske inte fel men oftast så rör det sig nog om fler avlägsna släktskap och mindre sällan om bara ett närmare släktskap.

Hans Olof Johansson · 2017-03-22, 23:02

Hej igen, Marcus!

Om ditt första inlägg imorse var ett svar på andra stycket i mitt inlägg ovan, så var det nog inte riktigt vad jag hade tänkt mig.

Jag tycker också att en enkel modell är bättre än ingen modell alls. Lyckligtvis erbjuder FTDNA sina kunder vissa möjligheter att själv ändra rangordningen av träffarna. Jag väljer följaktligen att strunta i FTDNA:s algoritm - som fokuserar på det längsta gemensamma segmentet - och sorterar numera istället bara efter den totala mängden gemensamt DNA. Men åtminstone tidigare, när längden på träfflistan var betydligt mera hanterlig, var det främst andra saker jag i första hand tittade på, inte minst släktträden och i brist på sådana t ex träffarnas födelseplatser, eller undersökte om de också matchade redan identifierade släktingar bland övriga träffar.

Tyvärr är det många som blint litar på FTDNA:s uppskattningar och därmed riskerar att missa många av sina faktiska släktingar på träfflistan. Häromdagen såg jag i Facebookgruppen DNA-anor en som önskade filtrera bort alla träffar med ett längsta block under 15 cM från sin lista. Om jag skulle ha gjort det, skulle jag bara ha hittat sju av mina 32 dokumenterade släktingar och förmodligen varit ännu mer frustrerad än jag är.

Hälsningar
Hans Olof

Marcus Boman · 2017-03-23, 14:43

Ett litet tillägg.

Om fokus på ett segment.

Ju längre segment med avseende på genetiskt avstånd (cM) desto mer sannolikt att segmentet ska fragmentiseras under generationernas lopp.

Annorlunda uttryckt.

Ju längre gemensamt DNA-segment (cM) två testade personer har desto mer sannolikt att man är närmare besläktade (färre generationer=färre fragmentiseringsmöjligheter).

(Generationer i sista stycket: antalet generation mellan testad person A och testad person B via gemensamma förpersoner)

Christina Blanck · 2017-10-10, 11:48

Hej, jag undrar om det kan hända att så nära släktingar som tremänningar inte får varandra som matchningar på Family Finder?

Mats Ahlgren · 2017-10-21, 00:48

Allt är möjligt när slumpen finns med, men det som brukar gälla, statistiskt, är att 10 % av fyrmänningar och 50% av femmänningar inte syns.

Författare Ämne: FTDNA Family Finder (läst 7027 gånger)

Marcus Boman

FTDNA Family Finder

Marcus Boman

SV: FTDNA Family Finder

Hans Olof Johansson

SV: FTDNA Family Finder

Marcus Boman

SV: FTDNA Family Finder

Marcus Boman

SV: FTDNA Family Finder

Hans Olof Johansson

SV: FTDNA Family Finder

Marcus Boman

SV: FTDNA Family Finder

Christina Blanck

SV: FTDNA Family Finder

Mats Ahlgren

SV: FTDNA Family Finder

Annonser

Marknaden

Köp och Sälj