AncestryAI-algoritmi piirtää sukupuusi yli 300 vuoden päähän

16.03.2017

Sukupuualgoritmi etsii automaattisesti lasten todennäköisimmät vanhemmat ja piirtää näin muodostuneita sukupuita.

AncestryAI piirtää sukupuita.

Aalto-yliopiston tohtorikoulutettavan Eric Malmin kehittämä AncestryAI-niminen sukupuualgoritmi etsii linkkejä 5 miljoonan kastetapahtuman välillä 1600-luvun lopulta 1800-luvun puoliväliin ja osin 1900-luvun alkuun. Omien sukujuurten tutkimiseksi täytyy olla tietoinen omasta esi-isästään, koska viimeisten sadan vuoden ajalta kastetapahtumat eivät ole julkista tietoa.

”Aineisto on peräisin Historiakirjoista eli HisKi-projektista, jota organisoi Suomen Sukututkimusseura ja jossa vapaaehtoiset sukututkijat tallettavat kirkonkirja-aineistoja tietokantaan. Kastetapahtumien lisäksi aineisto sisältää naimisiin menneitä, haudattuja ja muuttaneita, joita algoritmi ei kuitenkaan toistaiseksi vielä hyödynnä. Aineistossa on aukkoja johtuen esimerkiksi kirkkojen palamisesta, mutta siitä huolimatta se on kansainvälisestikin harvinaisen kattava sisältäen tietoja usean vuosisadan ajalta”, kertoo Malmi.

Sukupuualgoritmi etsii automaattisesti lasten todennäköisimmät vanhemmat ja piirtää näin muodostuneita sukupuita. Algoritmi antaa useita vaihtoehtoja perustuen vanhempien syntymäaikaan, nimien samankaltaisuuteen ja syntymäpaikkaan. Koko aineiston linkittämiseen algoritmilta kuluu noin puoli tuntia.

”Polkuhaun avulla taas voi selvittää, ovatko kaksi henkilöä jotain kautta sukua toisilleen. Monia saattaa esimerkiksi kiinnostaa, ovatko he jotain sukua Aleksis Kivelle tai muille tunnetuille historian henkilöille. Täytyy kuitenkin ottaa huomioon, että jos polku on pitkä ja kaikki linkit ovat epävarmoja, on hyvin epätodennäköistä että polku on kokonaisuudessaan oikein”, tähdentää Malmi.

AncestryAI:n käyttäjät voivat jättää kommentteja algoritmin päättelemien sukulaisuussuhteiden paikkansapitävyydestä. Kommenttien avulla avulla algoritmia voidaan kouluttaa päättelemään sukulaisuussuhteet entistä tarkemmin, ja kommentit näkyvät myös muille käyttäjille.

”Koko Suomen kattava sukupuu olisi kiinnostava, koska sen avulla voitaisiin tutkia esimerkiksi sotien, epidemioiden ja luokkayhteiskunnan vaikutuksia ja muutosta. Toistaiseksi se ei kuitenkaan ole mahdollista, koska esimerkiksi rippikirjat eivät ole algoritmin käytössä. Algoritmi ei korvaakaan sukututkijan tekemää työtä, vaan toimii siinä avustavassa roolissa, nopeuttaen ja osin myös tarkkuutta parantaen”, lisää Malmi lopuksi.

Malmi esittelee AncestryAI:ta Suku 2017 -tapahtumassa Otaniemessä 19.3.2017. Huhtikuun alussa Malmi esittelee algoritmin teknisiä ominaisuuksia ja linkityksiä World Wide Web -konferenssissa Australiassa.  AncestryAI on käytettävissä osoitteessa http://ancestryai.cs.hut.fi/ ja vaatii toimiakseen joko Chrome- tai Firefox-selaimen. AncestryAI on osa Malmin väitöskirjatutkimusta.

Lisätietoa:

Eric Malmi
Tohtorikoulutettava
Aalto-yliopisto, tietotekniikan laitos
eric.malmi@aalto.fi

www.genealogia.fi

hiski.genealogia.fi