MyHeritage wprowadza Book Matching

MyHeritage wprowadza Book Matching

Przedstawiamy rewolucyjną, nową technologię – Book Matching – prawdopodobnie nasz najlepszy dotychczas produkt. Book Matching automatycznie wyszukuje osoby z drzew genealogicznych na MyHeritage  w naszej kolekcji zdigitalizowanych książek historycznych.

Unikalnie dla MyHeritage, ta nowa, innowacyjna technologia wykorzystuje analizę semantyczną, aby zrozumieć każde zdanie z każdej strony w zdigitalizowanych książkach, w celu znalezienia połączenia z wysoką dokładnością.

Book Matching pomoże nam odkrywać informacje rodzinne, których nie znajdziemy nigdzie indziej. Zapewne dzięki tej technologii uda Ci się odkryć krewnych i przodków. Zachęcamy Cię do użycia tej informacji, aby rozwinąć swoje drzewo genealogiczne.

W ramach przypomnienia, naszą wyszukiwarkę danych historycznych SuperSearch™ wprowadziliśmy w 2012 roku. W grudniu 2015 roku, kolekcja zdigitalizowanych książek historycznych została dodana do SuperSearch™. Ostatnio potroiliśmy liczbę książek z liczby 150 000 do 450 000, z całkowitą ilością 91 miliona stron. Zebraliśmy zespół cieżko pracujących kuratorów i planujemy dodać setki milionów dodatkowych zdigitalizowanych książek do kolekcji, każdego roku.

Wyzwanie

Książki od zawsze były jednym z najlepszych źródeł do badań historii rodzinnej, jednak efektywne ich przeszukiwanie wymagało wiele pracy i czasu. Nawet jeśli książki zostały sfotografowane i skonwerowane do postaci cyfrowej, z możliwością wyszukiwania tekstu za pomocą optycznego rozpoznawania znaków (OCR), zawsze wymagało to dużej inwestycji czasu i chęci przebrnięcia przez niekończące się fałszywe alarmy. Na przykład jeśli w swoim drzewie genealogicznym posiadasz osobę o imieniu i nazwisku Richard Kwiatkowski, przeprowadzając przeszukiwanie tekstu w książkach znajdziemy wyniki osobno dla Richard, i osobno dla Kwiatkowski. Nawet jeśli uda nam się znaleźć wynik dla Richard Kwiatkowski, nie będziesz miał pewności, czy jest to aby napewno Richard Kwiatkowski, który urodził się w USA, w stanie Virginia, w 1940 roku, i poślubił Wilmę Griffith.

Book Matching na ratunek

Nasza technologia Book Matching przezwyciężyła te trudności poprzez automatyczne rozumienie narracji opisującej ludzi w książkach historycznych, w tym nazwisk, wydarzeń, dat, miejsc, relacji, i porównuje (dopasowuje) je z bardzo dużą dokładnością i szybkością do 2 miliardów osób w drzewie genealogicznym na MyHeritage; proces ten jest automatycznie powtarzany w miarę tego, jak Twoje drzewo rośnie o nowe osoby, i jak dodajemy nowe książki.

Trudne zadanie wykonane w prosty sposób

Wyodrębnienie informacji genealogicznych z książek nie jest prostym zadaniem. W standardowych dokumentach, takich jak akty urodzenia czy dokumnety z ewidencji ludności, informacja na temat faktów jakie otrzymamy jest jasna. Owczywiste jest, gdzie można znaleźć nazwiska, daty urodzenia, i tak dalej. Z drugiej strony, w niestrukturalnych danych free-tekstowych, takich jak zdigitalizowane książki historyczne, fakty takiej jak data urodzenia, lokalizacje, czy dat zgonu mogą zostać zapisane w różnoraki sposób i w różnych kontekstach. Podczas, gdy ogólne wyrażenia, takie jak „śmierć”, „zgon”, czy „zmarł” mogą wszystkie odnosić się do śmierci, tak również mniej używane jak „zakończył żywot”, czy „odszedł do domu Pana”.

Obecnie posiadamy ogromną liczbę słów kluczowych, które służą do wykrycia informacji w książkach dotyczących śmierci. Książki jednak często nie wspominają osób z ich pełnymi nazwiskami. Przykład. W akapicie wspomniane jest imię kobiety, a następnie raz jeszcze imię i fakty na temat jej ojca – potrzebna jest wyspecjalizowana technologia, aby nadążać za tym i wychwycić odpowiednie informacje. Ciężko pracowaliśmy, aby opracować wiele algorytmów do odnajdywania informacji na temat osób z drzew w książkach. Przed wdrożeniem produkt był wielokrotnie testowany, po wycwyceniu błędów – poprawiany, tak aby zapewnić, jak najwyższy poziom dokładności. Podczas pracy nad produktem, sukcesywnie przezwyciężyliśmy miliony błędów dotyczących optycznego rozpoznawania znaków (OCR). Na przykład jeśli proces OCR sądził, że osoba urodziła się w „]aju”, my wychwycamy, że chodzi o maj, „Kcień” to naprawdę „Kwiecień”, i tak dalej.

Na chwilę obecną, wiele książek w zbiorach cyfrowych jest zduplikowanych, ponieważ były one wdrażane do domeny publicznej wielokrotnie poprzez różne grupy. Obecnie dopracowano specjalistyczną technologię, która jest w stanie wykryć powielanie książek.

Book Matching w akcji

W ostatnim czasie pokazaliśmy kiklu blogerom genealogicznym, jak działa nasz produkt Book Matches.

Na przykład Dick Eastman z Eastman’s Online Genealogy Newsletter odkrywał historię swojej rodziny latami. Obecnie posiada około 2780 osób w swoim drzewie na MyHeritage, i otrzymał około 500 połączeń z książek. Większość informacji odnalezioncyh w książkach byłą dla niego całkiem nowa.

Co więcej, Elizabeth Fifield, bezpośredni przodek Dick’a (ciocia z 8mej generacji) – pojawiałą się w jego drzewie genealogicznym jedynie z rokiem urodzenia i zgonu, i rodzeństwem.

Automatyczne połączenie – Book Matching – zostało odnalezione dla Elizabeth w książce „Genealogical and personal memoirs relating to the families of the state of Massachusetts”; by Cutter, William Richard, 1847-1918,” – źródła, które Dick Eastman nigdy wcześniej nie widział na oczy.

Wycinek poniżej to sekcja, która została odnaleziona przez MyHeritage. Zawarta tutaj ekscytująca informacja wspomina on mężu Elizabeth, i o innych informacjach historycznych na temat jego i jego rodziny, jak informacja o ich szóstce dzieci, datach urodzenia – są to informacje, których Dick nie posiadał wcześniej w swoim drzewie, a teraz mógł dodać do swojej gałęzi.

Genealog Randy Seaver  Genea-Musings posiada ponad 40 tysięcy osób w drzewie na MyHeritage. Z liczbą 20 609 Book Matches będzie mógł teraz zebrać górę nowych informacji na temat swoich przodków.

Na przykad, Randy w swoim drzewie ma krewnego – Williama Seavera Woodsa – wraz z datą urodzenia i informację, że nie był żonaty.

W roczniku „Alumni Record of Wesleyan University, Middletown, Connecticut, 1921” – MyHeritage odnalazł połączenie dla Williama.

William studiował na tym uniwersytecie, a strona zawiera informacje na temat jego osiągnieć, wspominając że miał żonę i dziecko – Randy nie posiadał tych informacji dotychczas w swoim drzewie. Zauważ, że ich syn, Robert, używał nazwiska Crombie, które pochodziło od jego matki Grace. Jako, że Robert nie używał nazwiska Seavor lub Woods, Randy mógłby nie odkryć tej informacji. Teraz posiada nowe połączenie – i może kontynuuować odkrywanie tej gałęzi rodziny.

Leland Meitzler z Genealogy Blog zimportował swoje drzewo genealogiczne składające się z 5106 osób do MyHeritage. Otrzymał 694 Book MAtches. Otrzymał powiadomienie na temat połączenia dotyczącego Elishy Mills, odnalezione książce „A Walloon Family in America: Lockwood de Forest and His Forbears 1500-1848,” (1914).

Połączenie dodaje rodziców Elishy i opisuje jego dokonania podczas Wojny Rewolucyjnej.

W końcu, Pat Richley z Dear Myrtle także otrzymał Book Matches. Praprapradziadek Pata, Thomas Wasden wcześniej pojawiał się w drzewie z podstawowymi informacjami, łącznie z datami i miejscami.

Połączenie dla Thomasa zostało automatycznie odnalezione w książce „Colonial Families of Philadelphia by Jordan, John Woolf, 1840-1921” (1911).

Połączenie zawierało zdjęcia z XX wieku. Tę informację Pat może teraz dodać do swojego drzewa genealogicznego.

Blogerzy genealogiczni byli bardzo podekscytowani tymi informacjami, które dodają wartościowych informacji do ich drzew genealogicznych. Nie wystąpiły żadne fałszywe alarmy. Book Matching może dostarczyć ogromnej ilości nowych danych dla doświadczonych genealogów, którzy badają swoją historię rodziny od dziesięcioleci.

Kompilacja zbiorów publikoanych źródeł jest bezpłatna. Przeglądanie i korzystanie z Book Matches wymaga subskrypcji MyHeritage na dane.

Co dalej?

Book Matching obecnie jest dostępne jedynie dla książek w języku angielskim, jednak technologia wkrótce zostanie udoskonalona o inne języki. Stale poszerzamy nasze repozytorium rekordów historycznych, ułatwiając badania historii rodziny. Oczekujemy, że korpus zdigitalizowanych książek na MyHeritage wkrótce zostanie podwojony. Planujemy dodanie niesamowitych książek z całej Europy!

Skąd wiesz, że otrzymałeś Book Matches?

Po prostu zaloguj się do swojej witryny rodziny i za pomocą menu Odkryć sprawdź swoje Record Matches, lub też sprawdź swoją skrzynkę z wiadomościami na temat Record Match.

Jesteś nowy na MyHeritage? Zarejestruj się na naszej witrynie i załaduj swoje drzewo genealogiczne jako plik GEDCOM, i korzystaj z Book Matching – która znajduje się wyłącznie na MyHeritage.

Życzymy wspaniałych odkryć!

Komentarze

Adres e-mail jest prywatny i nie będzie wyświetlany.

  • Sianin

    15 kwietnia, 2016

    „Book Matching pomoże nam odkrywać informacje rodzinne, których nie znajdziemy nigdzie indziej. Zapewne dzięki tej technologii uda Ci się odkryć krewnych i przodków. Zachęcamy Cię do użycia tej informacji, aby rozwinąć swoje drzewo genealogiczne.”

    A może ja tego nie chcę?