"Valkeala-projektini" CSV-tuonnin testaamiseksi

25 views
Skip to first unread message

Pekka Valta

unread,
Apr 11, 2016, 4:05:34 AM4/11/16
to Gramps Finland
Gramps tukee tietojen tuontia CSV-muodossa . Päätin kokeilla sen käyttökelpoisuutta tietojen massatuontiin. Otin koekaniiniksi mummoni syntymäpitäjän Valkealan, jota en ollut tutkinut lainkaan aikaisemmin.

Kopsasin Hiskistä kaikki Kastetut, Haudatut ja Syntyneet, mikä sujui yllättävän helposti 1000 Hiski-tapahtuman erissä Excelin kautta. Haasteeksi muodostui se, että Hiskin "henkilönimi"-kentissä on hyvin sekavasti nimi, ammatti yms tietoja. Ne piti purkaa omiin, CSV-kuvauksen mukaisiin kenttiinsä, jotta tiedot menevät Gampsissä heti oikeisiin paikkoihinsa. Jälkikorjaus olisi Grampsin puolella mahdottoman työläs urakka. Tein siivous- ja purkuhomman ilmaisella OpenRefine-ohjelmalla, joka sopii "sumean" datan käsittelyyn paremmin kuin Excel.

Aineistojen tuonti Grampsiin tapahtuu vaiheittain: ensin paikat, sitten henkilöt, sitten perhesuhteet.

Nyt suunnittelen, miten kokoan mummoni.sukupuun pienimmällä vaivalla 50 000 henkilön Valkeala-kannallastani, jossa on kattavat Hiskin mukaiset tiedot vv. 1701-1853 aikaväliltä, . Raportoin tämän vaiheen sujumisesta myöhemmin.

Ps. Hiski on vain tukihakemisto ja mummoni sukupuu on on tietysty verifioitava varsinaisista digikuvatuista lähtestä.
Reply all
Reply to author
Forward
0 new messages