SPARQL-server för LIBRIS

0 views
Skip to first unread message

Martin Malmsten

unread,
Apr 15, 2009, 6:44:22 AM4/15/09
to ss...@googlegroups.com
Hej,

den experimentella SPARQL-servern för LIBRIS (http://lab3.libris.kb.se/sparql
) innehåller nu väsentligt mer information än tidigare. Jag har laddat
alla auktoritetsposter (1.7M tripplar) och bibliografiska poster (68M
tripplar) samt länkar mellan dem (3M tripplar).

Allt data som man får ut via Linked Data är ännu inte med, det rör sig
om länkar mellan utgåvor av samma verk samt kopplingar till bilioteken.

Visst stöd för HTTP content negotiation finns, så man kan göra följande:

curl --header accept:application/sparql-results+xml "http://lab3.libris.kb.se/sparql?query=select+%3Fs+where+%7B+%3Fs+%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23prefLabel%3E+%22Mödrar%22%40sv+.+%7D%0D%0A
"

och:

curl --header accept:text/rdf+n3 "http://lab3.libris.kb.se/sparql?query=describe+%3Chttp%3A%2F%2Flibris.kb.se%2Fresource%2Fbib%2F12345%3E
"

Jag använder Sesame Native Store och det tog >40 timmar att ladda
alltihop första gången. Laddprestanda gick ned påtagligt efter ett par
miljoner tripplar, gissningsvis eftersom indexfilerna då var större än
filsystemcachen --> all tid går åt till att flytta data mellan minne
och disk. Laddade om med databasen i /tmp (som på Solaris är monterad
i VM) på en maskin med mycket minne, då tog det runt 3.5 timme.

Ska försöka få till laddning åtminstone veckovis.

mvh,
Martin Malmsten

---------------------------------------------
Martin Malmsten
Systemutvecklare / Senior Developer
Avdelningen för Nationell samverkan/LIBRIS

Kungl. biblioteket/National Library of Sweden
E-post: martin....@kb.se
libris.kb.se

Reply all
Reply to author
Forward
0 new messages