Ulepszenia w narzędziu cM Explainer™

Ulepszenia w narzędziu cM Explainer™

W zeszłym miesiącu podczas RootsTech 2023 ogłosiliśmy wydanie cM Explainer™, zaawansowanej funkcji, która szacuje powiązania rodzinne pomiędzy dopasowaniami DNA. Dla każdego dopasowania DNA, cM Explainer™ przedstawia przewidywania możliwych relacji między dwoma osobami i ich prawdopodobieństwa. cM Explainer™ wykorzystuje nowatorskie podejście, które oblicza prognozę relacji przy użyciu wieku osób, poza ilością wspólnego DNA. Jak w przypadku wszystkich funkcji MyHeritage, stale udoskonalamy cM Explainer™, aby poprawić jego dokładność. Dziś z przyjemnością dzielimy się kilkoma ulepszeniami, które wprowadziliśmy do cM Explainer™, aby poprawić jego dokładność przewidywania dla odległych dopasowań DNA.

Ulepszone prognozy dla odległych dopasowań DNA

Dopasowania DNA na MyHeritage pojawiają się domyślnie w kolejności malejącej, od największej ilości wspólnego DNA do najmniejszej. Gdy występuje niewielka ilość wspólnego DNA, rozróżnienie odległych relacji staje się trudniejsze. Wraz ze wzrostem liczby możliwych relacji, może stać się jeszcze trudniej przewidzieć dokładne relacje pomiędzy dwoma osobami.

Ostatnio dostroiliśmy nasz model przewidywania, aby lepiej radził sobie z niskimi wartościami centymorganów (cM). W rezultacie, niektóre dopasowania DNA otrzymają teraz przewidywania wskazujące na bardziej odległe pokrewieństwo niż wcześniej. Na przykład, dopasowania, które wcześniej były przewidywane jako prawdopodobne dalsze kuzynowstwo (w 3. linii) mogą teraz pojawić się jako prawdopodobne dalsze kuzynostwo (w 4. linii), a dalszy kuzyn (z 4. linii) może teraz pojawić się jako prawdopodobny dalszy kuzyn z 5. linii. To ulepszenie modelu cM Explainer™ ma zastosowanie do przewidywań relacji dla dopasowań DNA na MyHeritage, a także podczas analizowania dopasowań przy użyciu odrębnego narzędzia cM Explainer™.

Innym dodatkiem, który wprowadziliśmy, jest to, że dla wszystkich dopasowań z 100 cM lub mniejszym wspólnym DNA, odnosimy się teraz do przewidywań dotyczących związku jako „szacowanego związku”, a nie „prawdopodobnego związku”. Dokonaliśmy tej zmiany, ponieważ przewidywania są nieuchronnie mniej dokładne dla niskich wartości centymorganów.

Estimated relationships for matches of less than 100cM

Szacowane relacje dla dopasowań mniejszych niż 100cM (kliknij, aby powiększyć)

Dokładniejsze prognozy dla odległych dopasowań dla Żydów pochodzenia aszkenazyjskiego

Pośród populacji endogamicznych, gdzie występuje duża częstość zawierania małżeństw w obrębie tej samej społeczności, dwie osoby mogą mieć wspólne DNA od wielu wspólnych przodków. Powoduje to, że ilość wspólnego DNA jest większa niż oczekiwana dla ich związku. Pierwotnie, cM Explainer™ nie brał pod uwagę pochodzenia etnicznego dopasowań DNA podczas obliczania przewidywań relacji, co oznaczało, że prawdopodobne relacje pomiędzy niektórymi dopasowaniami wydawały się bliższe niż są w rzeczywistości.

W ramach tej aktualizacji, dostroiliśmy przewidywania relacji dla dopasowań DNA na MyHeritage z pochodzeniem etnicznym Żydów Aszkenazyjskich, z powodu historii endogamii w tej społeczności. To dostosowanie jest stosowane do odległych dopasowań DNA z mniej niż 200 cM wspólnego DNA. cM Explainer™ wykorzystuje teraz formułę opracowaną przez nasz zespół naukowy, która uwzględnia stopień żydowskiego pochodzenia aszkenazyjskiego w dopasowaniu DNA i dostosowuje wspólne DNA używane przez algorytm, aby zaoferować bardziej dokładne przewidywanie związku. Im więcej aszkenazyjskiego pochodzenia etnicznego dzielą dwie osoby, tym większa jest korekta algorytmu. MyHeritage jest pierwszą i jedyną firmą, która zapewnia przewidywania relacji, które uwzględniają endogamię. Ta korekta nie jest dostępna w oddzielnym narzędziu cM, ponieważ narzędzie nie bierze pod uwagę danych etnicznych.

W poniższym przykładzie, jedno dopasowanie ma 44 lata i 90,7% etnicznego pochodzenia aszkenazyjskiego, a drugie ma 54 lata i 96,4% etnicznego pochodzenia aszkenazyjskiego i mają 70 cM wspólnego DNA. Pierwotne przewidywanie relacji dla tego dopasowania wskazywało na prawdopodobną relację kuzynowstwa w 3 linii. Po ogólnym ulepszeniu modelu przewidywania, wraz z dodanymi poprawkami dla dwóch dopasowań ze znaczącym żydowskim pochodzeniem aszkenazyjskim, cM Explainer™ prognozuje teraz relację kuzynowstwa w 5 linii. i nazywa ją „szacowaną”, a nie „prawdopodobną”.

Improved prediction for distant matches with Ashkenazi Jewish ethnicity

Ulepszona prognoza dla odległych dopasowań z etnicznym pochodzeniem Żydów aszkenazyjskich (kliknij, aby powiększyć)

Być może w przyszłości doprecyzujemy algorytm, aby zapewnić dokładniejsze prognozy dla dodatkowych populacji endogamicznych.

Podsumowanie

Nieustannie ulepszamy cM Explainer™, aby zwiększyć dokładność przewidywań dotyczących pokrewieństwa. Mamy nadzieję, że te ulepszenia pozwolą Ci bardziej efektywnie zarządzać swoimi dopasowaniami DNA i lepiej zrozumieć relacje rodzinne.