den experimentella SPARQL-servern för LIBRIS (http://lab3.libris.kb.se/sparql
) innehåller nu väsentligt mer information än tidigare. Jag har laddat
alla auktoritetsposter (1.7M tripplar) och bibliografiska poster (68M
tripplar) samt länkar mellan dem (3M tripplar).
Allt data som man får ut via Linked Data är ännu inte med, det rör sig
om länkar mellan utgåvor av samma verk samt kopplingar till bilioteken.
Visst stöd för HTTP content negotiation finns, så man kan göra följande:
curl --header accept:application/sparql-results+xml "http://lab3.libris.kb.se/sparql?query=select+%3Fs+where+%7B+%3Fs+%3Chttp%3A%2F%2Fwww.w3.org%2F2004%2F02%2Fskos%2Fcore%23prefLabel%3E+%22Mödrar%22%40sv+.+%7D%0D%0A
"
och:
curl --header accept:text/rdf+n3 "http://lab3.libris.kb.se/sparql?query=describe+%3Chttp%3A%2F%2Flibris.kb.se%2Fresource%2Fbib%2F12345%3E
"
Jag använder Sesame Native Store och det tog >40 timmar att ladda
alltihop första gången. Laddprestanda gick ned påtagligt efter ett par
miljoner tripplar, gissningsvis eftersom indexfilerna då var större än
filsystemcachen --> all tid går åt till att flytta data mellan minne
och disk. Laddade om med databasen i /tmp (som på Solaris är monterad
i VM) på en maskin med mycket minne, då tog det runt 3.5 timme.
Ska försöka få till laddning åtminstone veckovis.
mvh,
Martin Malmsten
---------------------------------------------
Martin Malmsten
Systemutvecklare / Senior Developer
Avdelningen för Nationell samverkan/LIBRIS
Kungl. biblioteket/National Library of Sweden
E-post: martin....@kb.se
libris.kb.se