Väitös tietotekniikan alalta, DI Eric Malmi

2018-06-20 12:00:00 2018-06-20 23:59:57 Europe/Helsinki Väitös tietotekniikan alalta, DI Eric Malmi Tietueiden linkitysmenetelmät päättelevät viiden miljoonan ihmisen sukupuun http://cs.aalto.fi/fi/midcom-permalink-1e8577b9b57b4be577b11e88183496e38a8eca9eca9 Maarintie 8, 02150 , Espoo

Tietueiden linkitysmenetelmät päättelevät viiden miljoonan ihmisen sukupuun

20.06.2018 / 12:00

DI Eric Malmi väittelee keskiviikkona 20.6.2018 klo 12 Aalto-yliopiston perustieteiden korkeakoulussa, salissa AS1, Maarintie 8, Espoo. Väitöskirjassa "Collective entity resolution methods for network inference" osoitetaan, kuinka tietueiden linkitysmenetelmät mahdollistavat laajojen sukupuiden automaattisen päättelyn sekä yhteiskunnallisten muutosten laskennallisen tarkastelun pitkällä aikavälillä.

Väitöskirjassa on kehitetty tietueiden linkitysmenetelmiä suurten aineistojen automaattiseen yhdistämiseen. Menetelmiä on sovellettu muun muassa viiden miljoonan Suomesta kerätyn kastetapahtuman linkittämiseen. Näin muodostettua sukupuuta on mahdollista tarkastella työssä kehitetyn, avoimesti saatavilla olevan AncestryAI-verkkopalvelun kautta. Automaattisesti pääteltyä sukupuuta on lisäksi sovellettu luokkajaon muutosten tutkimiseen Suomessa vuosina 1735-1885; yhteiskuntaluokka vaikuttaa selvästi ihmisten puolisonvalintaan, mutta ilmiössä ei yllättäen havaita systemaattista heikkenemistä tai vahvistumista.

Sukuaineistojen automaattinen linkitys on laskennallisesti haastava ongelma samannimisistä henkilöistä sekä henkilötiedoissa olevista virheistä johtuen. Työssä kehitetyt linkitysmenetelmät perustuvat tiedonlouhinnan ja koneoppimisen menetelmiin, jotka oppivat linkittämään tietoja ihmisten keräämään opetusaineiston perusteella. Menetelmiä voidaan soveltaa sekä yksittäisten tietojen, kuten kastetapahtumien, linkittämiseen tai verkostojen, kuten eri ihmisten sukupuiden, yhdistämiseen. Sukuaineistojen lisäksi menetelmiä on sovellettu muun muassa sosiaalisten verkostojen sekä biologisten verkostojen yhdistämiseen. 

Väitöstiedote (pdf)

Vastaväittäjä: Professor David Gleich, Purdue University, Yhdysvallat

Kustos: professori Aristides Gionis, Aalto-yliopiston perustieteiden korkeakoulu, tietotekniikan laitos