Svenska vokabulärer i SKOS?

14 views
Skip to first unread message

Peter Krantz

unread,
Mar 20, 2009, 5:27:39 AM3/20/09
to ss...@googlegroups.com
Hej!

Inom ramen för rättsinformationsprojektet tar vi fram ett sätt för
myndigheter att beskriva ämnesklassificeringar på ett strukturerat
sätt. Syftet är att myndigheter som idag klassificerar
rättsinformationsdokument med nyckelord skall göra det på ett
enhetligt sätt. Utöver den enklaste formen (strängliteral i dublin
core subject [1]) kommer vi att rekommendera SKOS [2] för de
myndigheter som vill precisera sina begrepp. Vi hoppas att fler kommer
att ta efter detta arbetssätt inom andra områden än just
rättsinformation.

Är det någon annan på listan som arbetat med SKOS och eventuellt har
referenser till publicerat material? Jag letar i första hand efter
enklare termförteckningar.

(På sikt hade man önskat att alla kunde utgå från en gemensam
vokabulär (typ EUROVOC [3]) men tills dess att den finns i något bra
maskinläsbart format och alla är överens får det vara.)

Mvh,

Peter

[1]: T.ex. <dces:subject xml:lang="sv">Arbetsmiljöarbete</dces:subject>
[2]: http://www.w3.org/TR/2009/CR-skos-reference-20090317/
[3]: http://europa.eu/eurovoc/

Martin Malmsten

unread,
Mar 24, 2009, 10:51:30 AM3/24/09
to ss...@googlegroups.com
Svenska Ämnesord finns som Linked Data i LIBRIS[1], med länkar till
det som var lcsh.info (ersätts med id.log.gov[2], som tydligen ska
finnas på plats "inom kort"). Tyvärr saknas ännu broaderTerm och
narrowerTerm på stor del av materialet än så länge.

Exempel:
curl --location --header accept:text/rdf+n3 "http://libris.kb.se/resource/auth/154863
"

Skulle en RDF-dump av hela Svenska Ämnesord vara av intresse går det
att fixa.

/martin

1. http://blog.libris.kb.se/semweb/
2. http://id.loc.gov/

Peter Krantz

unread,
Mar 25, 2009, 4:18:55 AM3/25/09
to ss...@googlegroups.com
2009/3/24 Martin Malmsten <martin....@kb.se>:

>
> Skulle en RDF-dump av hela Svenska Ämnesord vara av intresse går det
> att fixa.
>

Hej!

Intressant. Vem underhåller Svenska Ämnesord? Det hade ju varit grymt
om den fanns på en permanent plats på nätet med URI:er till termer.
Jag misstänker att det är flera som skulle vilja använda den och jag
tror att det kunde bidra till enklare möjligheter att hitta
information inom många verksamhetsområden.

Mvh,

Peter

Fredrik Paulsson

unread,
Mar 25, 2009, 4:30:53 AM3/25/09
to ss...@googlegroups.com
Hej
Det är KB (http://www.kb.se/ amne...@kb.se.) som är ansvariga för den.
Mvh
Fredrik

Peter Krantz skrev:
fredrik_paulsson.vcf

Martin Malmsten

unread,
Mar 25, 2009, 5:55:59 AM3/25/09
to ss...@googlegroups.com
KB underhåller SAO. SAO registreras i LIBRIS. LIBRIS finns som Linked
Data.

Sent from my iPhone

On 25 mar 2009, at 09.30, "Fredrik Paulsson" <fredrik....@educ.umu.se
> begin:vcard fn:Fredrik Paulsson n:Paulsson;Fredrik org;quoted-
> printable:Ume=C3=A5 University;Dept. of Interactive Media and
> Learning (IML) adr;quoted-printable:;;;Ume=C3=A5;;SE-90187;Sweden
> email;internet:fredrik....@educ.umu.se title:Assistant
> Professor/Senior Lecturer (Lektor) tel;work:+46 (0)90 786 6963
> tel;fax:+46 (0)90 786 9695 tel;cell:+46 (0)70 5605358 note;quoted-
> printable:-----BEGIN PGP PUBLIC KEY BLOCK-----=0D=0A= Version: GnuPG
> v1.4.7 (Darwin)=0D=0A= =0D=0A=
> mQGiBEhgF68RBACM7RuzQW6WlSiirX3Wy2lJkVDn7+
> e2OyF1Pok3IE7DdUBGlB54=0D=0A=
> qLrNoEt2JpM3Im1o11QPej6NQhKE2br2UFpjXe4km6/
> SPpUlQT9Zgr6IQL4ja3lo=0D=0A= CtsXyC1Z8EZyy++7MDi
> +5MqcQcNzgVq7MMKLQKy2FMqGcWOBhEnnDcMA2wCgssYS=0D=0A=
> c230uBKSMP5/00H9X9NlXQ8D/iZTlW2H8IQrtEafhHXqZt2mbctkYHijEAFC/
> oKh=0D=0A= +TPEID9kraZKjzMqM85jUerBTz/YAwhu9kOy/
> Bi2T5PW693QGLUDaP6Xl9FHdtJq=0D=0A=
> yP5dc3vA50MDHyEANGWYakhL3AFa9HWD6QscAWa58spaoPcfWWq4vSOmF23z3+
> E6=0D=0A= 0lILA/9bMo35i8Tg8+HZS/HbieQMaU2Ai0w6Zo1E/VmH
> +EKEDEgaIhUb3E0I+v2Y=0D=0A=
> d9XJ9OsU6Uti4Tn0TW4aOsbtfG8RmEAU3ImWMVbCIatGJX6alppaqbxpx3uoixRi=
> 0D=0A=
> kJEzKuZ1XzZYWGskJyUSLglvIBa3wtn7edJvDoGvHcXafNnuvrQ0RnJlZHJpayBQ=
> 0D=0A=
> YXVsc3NvbiAoTlApIDxmcmVkcmlrLnBhdWxzc29uQGVkdWMudW11LnNlPohmBBMR=
> 0D=0A= AgAmBQJIYBevAhsjBQkJZgGABgsJCAcDAgQVAggDBBYCAwECHgECF4AACgkQx/
> Dp=0D=0A= xZ7EHpBWggCghmsILQtFov7F4ta0yU+zi19o67wAn2IoNPPP5fe2WQ6+YH/
> EjNNc=0D=0A= beAWuQQNBEhgF68QEACE9LjGnrMp4rVVK3EB8/
> jhAR4Uckj1+lBKeyDN8xn/ndl/=0D=0A=
> 1+5
> Sqqk0zPjCE8nEPYKgCVvZUpEsNHRrHez1iEJH1F3XqKvzd0UlEoYnm2+8RYJV=0D=0A=
> rmII4P304zIlDwc+X04VxE0/lm8X/DicTyTB/UESGkDl
> +REF4YkvdsvpeST19lNe=0D=0A=
> j1xb1hWJlupypiANDcbhLAFdyad7MViuzxwhuU73j4jRmZYL35lAhjL/cr
> +GbKBV=0D=0A=
> cbK0odwnV8P5QUyvmhiJHXYU7Xcfg7irJ9sHBDi0CvO2iiwHE9dlWMHqrL5nDgof=
> 0D=0A= L/imjHaV7mMnj1HwiV6mfWSXePcaPnlvohuk5D0a/
> cLQB0mo1QiA8ttEC8UsuOLe=0D=0A=
> kfbbWrqh00viS7xrMv9KA572VGEeKSpJH49QEgbLtwFjdaPUv1haPUYRfHgyhfIu=
> 0D=0A= xdDWCx760EZwv+dhd/BKuLhM147WaAm9uhnTzuKGmMvYto4xXS8qK1uqPp5/
> h//K=0D=0A= fJemzaMJLkIeUIGCsKsq1y7c4bn807PBkFn/
> VzXDgSJNUfjPY7xYPRfOcQlZwAgF=0D=0A= x
> +ElDzxyDYrGOPyU6PBatafzu73mbxD2MmuwlT7CL0DDGmHj1WA4giaH288p9PUZ=
> 0D=0A=
> 3R9WK0euFgbsY60eCwRvM0NMeURp3hJnJmPIKqH30KgQZHOaXwHkWgJDT3Z25wAD=
> 0D=0A= Bw/
> +NT3KOBhD0YcBX2YlvW0M3OhRZC1ob2mvfc6+Mp2ixhRenTHWJlxFpfNmRLzW=0D=0A=
> R8lAfy9ws/3UWx/
> XXwPPcsZYpCr3FP1HX8fEdpFRjXn0HLBIyeobackg4By1rscb=0D=0A=
> XvmRyCJDj32TjdUVe9j2Y7yI3EYS6c1ks6Df4266ciFKzx1rEbAn0ZFf9ZjfevlE=
> 0D=0A= DfbuGm9vT71ybAFZx5BaViT0cJKKhUYumF/p/PXHtGnvZBVBy7bJ
> +4qQb9z1Yydv=0D=0A= +XjzRSxF3X/
> NdVaUBN50Z7Wr0YWQntUoPuctcpK8G77WpCe6aWP71Vd9Gpvovwpx=0D=0A= NV//
> wRReYY4Ibpr16t6FpDWceXEJqapuGfolXZ73zUurI1n+nJiRHErYBpaEycf3=0D=0A=
> ZTPaNvAsyPozTQit7+Divouk52BTuzSP
> +59DLPJ4D5fyRbFSWOnhYJmzcN2ibWOz=0D=0A=
> caqanrx1ngpWmFishSe0yrdsHP3PnzI1z4aEQwHsqCxAqXEQTrJ7T0Tb1cGSiyHv=
> 0D=0A= jpuxGUJQmF/DEq5yefxkv2NM
> +EVzQnXDjrqk4pV5aYQPpfsFrNXCxhHi98SS6l7t=0D=0A= kmXxsVzHUVi
> +VeqCz7KkHdGmZtQCUraLyMfsaHx7RJ/QCCjD75lqozZ6vV38yLx8=0D=0A=
> efO4Fl8bo2RkDaTU4HzeIEPkjcDyjq5KRRajq/
> NX8fI9i12ITwQYEQIADwUCSGAX=0D=0A=
> rwIbDAUJCWYBgAAKCRDH8OnFnsQekMVdAJ98oItl19uX7CfYsDq
> +7UUBnWpknQCe=0D=0A= L67B2ZGpv28TnfVleWDJufBixss=3D=0D=0A=
> =3DUYMj=0D=0A= -----END PGP PUBLIC KEY BLOCK----- x-mozilla-
> html:FALSE url:http://www.iml.umu.se/ version:2.1 end:vcard

Martin Malmsten

unread,
Mar 25, 2009, 5:59:38 AM3/25/09
to ss...@googlegroups.com
Det är recis så det är tänkt. En permanent plats på nätet
alltså. Jämför med OCLC Identities. Fast med Linked Data i botten.

Sent from my iPhone

Peter Krantz

unread,
Mar 25, 2009, 6:13:24 AM3/25/09
to ss...@googlegroups.com
2009/3/25 Martin Malmsten <Martin....@kb.se>:

> Det är recis så det är tänkt. En permanent plats på nätet
> alltså. Jämför med OCLC Identities. Fast med Linked Data i botten.
>

Smutt! Precis vad vi behöver. Jag ser att ni även ordnat en
HTML-representation. Då är nästa fråga om det finns någon form av
servicelager ovanpå för att kunna hitta enskilda ämnesord? För de som
vill bruka den hade det varit fint med en:

http://libris.kb.se/service/auth/?q=Mödrar

som returnerade förslag. Då skulle applikationer direkt kunna erbjuda
ämnesordsklassificering på ett enkelt sätt.

Alternativt så lämpar man över den typen av funktionalitet på
respektive brukande organisation. Då kan man tänka sig att SAO hade en
dump (i RDF) och en Atom-feed från vilken man kunde följa
uppdateringar från det att man hämtat in den i ett eget system.

Med lite exempel på detta tror jag att Sverige skulle kunna bli grymt
på linked data generellt vilket kan leda till en stabil grund att
bygga vidare på nu när mängden elektronisk information ökar
lavinartat. På sikt kommer det att behövas sätt att enklare sålla i
massan och där passar detta perfekt.

Mvh,

Peter

mpa...@gmail.com

unread,
Mar 25, 2009, 7:07:09 AM3/25/09
to SSWIG
On Wed, 2009-03-25 at 11:13 +0100, Peter Krantz wrote:
> 2009/3/25 Martin Malmsten <Martin....@kb.se>:
...
> Då är nästa fråga om det finns någon form av
> servicelager ovanpå för att kunna hitta enskilda ämnesord? För de som
> vill bruka den hade det varit fint med en:
>
> http://libris.kb.se/service/auth/?q=Mödrar
>
> som returnerade förslag. Då skulle applikationer direkt kunna erbjuda
> ämnesordsklassificering på ett enkelt sätt.

Jag instämmer. En sparql enpoint vore inte heller fel för mer
komplicerade (och exakta) frågor.

>
> Alternativt så lämpar man över den typen av funktionalitet på
> respektive brukande organisation. Då kan man tänka sig att SAO hade en
> dump (i RDF) och en Atom-feed från vilken man kunde följa
> uppdateringar från det att man hämtat in den i ett eget system.

Ett komplement vore att använda OAI-PMH där man kan få bara den
metadata
som tillkommit efter ett visst datum.
Men mer praktiskt skulle jag bli nöjd om dumpen fanns tillgänglig på
en
viss addres om man visste att den uppdaterades med viss
regelbundenhet.

Mvh,
Matthias

Peter Krantz

unread,
Mar 26, 2009, 4:12:05 AM3/26/09
to ss...@googlegroups.com
2009/3/25 mpa...@gmail.com <mpa...@gmail.com>:

>
> Jag instämmer. En sparql enpoint vore inte heller fel för mer
> komplicerade (och exakta) frågor.
>

Det hade ju såklart varit fint också. Kanske kunde det finnas en för
Libris med, men det får kanske bli en senare fråga.

Jag har grävt vidare och antar att sökformuläret på
http://www.kb.se/bibliotek/svenska-amnesord/ söker i förteckningen. I
träffbilden hade jag gärna sett URI:n för ämnesordet.

Vi skulle ju gärna vilja att myndigheterna hellre brukade svenska
ämnesord än sina egna ofta odokumenterade ämnesord. Jag har gjort
några tester och det verkar som att det finns stora möjligheter till
detta.

Ex 1: Arbetsförmedlingens ämnesord:
http://www2.ams.se/regelbok/dokument/lagr_fort_b.htm
Ex 2: Arbetsmiljöverket http://www.av.se/lagochratt/sakordsregister/index.aspx

Kanske kunde man hitta en modell där myndigheternas huvudsakliga
ämnesord i varjefall utgår från svenska ämnesord och sedan
kompletteras med mer specifika saker i händelse av att de inte
existerar?

Det skulle kunna vara ett stort mervärde att erbjuda personer och
företag kopplingar mellan rättsinformation och litteratur om densamma.

Mvh,

Peter

PS. På sökformuläret finns två länkar längst ner. Båda leder till en
inloggningssida i Episerver vilket kanske inte är korrekt.

Martin Malmsten

unread,
Mar 31, 2009, 3:49:45 AM3/31/09
to ss...@googlegroups.com
Hallå,

visst hade det varit bra med en publik SPARQL-server. Det föll på att
vi inte visste hur tungt det skulle bli för vår MySQL-server, det är
ju väldigt lätt att ställa tunga frågor. Det och att Linked Data-
projektet bedrivs som "labs"-verksamhet, dvs kan komma lite i kläm.

Jag får utnyttja kompetensen i gruppen: finns det någon lättviktig
SPARQL-server som (helst) fungerar utan databas, helst Java eller
Python-baserad som kan ladda ett par hundra miljoner triples på rimlig
tid?

http://www.kb.se/bibliotek/svenska-amnesord skapas utifrån en dump
från LIBRIS, vet inte om de behåller LIBRIS-numret (som behövs för att
skapa URI:n).

Vad gäller att använda Svenska Ämnesord utanför bibliotekssektorn är
jag försiktigt positiv. Återkommer.

/martin

Peter Krantz

unread,
Mar 31, 2009, 4:00:30 AM3/31/09
to ss...@googlegroups.com
2009/3/31 Martin Malmsten <martin....@kb.se>:

>
> Jag får utnyttja kompetensen i gruppen: finns det någon lättviktig
> SPARQL-server som (helst) fungerar utan databas, helst Java eller
> Python-baserad som kan ladda ett par hundra miljoner triples på rimlig
> tid?
>

Vi har goda erfarenheter av http://www.openrdf.org/. Sesame fungerar
utan databas om man vill (och det finns flera andra backends). Om man
letar prestanda så verkar Virtuoso jobba hårt med prestandajusteringar
(varje gång det kommer någon uppdatering om Berlin SPARQL-benchmark
verkar de släppa en ny release).

Se mer här: http://www4.wiwiss.fu-berlin.de/bizer/BerlinSPARQLBenchmark/results/index.html

Sedan beror det ju såklart på vad du menar med "lättviktig":-)


> Vad gäller att använda Svenska Ämnesord utanför bibliotekssektorn är
> jag försiktigt positiv. Återkommer.
>

Säg till om du vill att jag kontaktar någon den andra vägen. Jag ser
fördelar gentemot att myndigheterna nu upprättar sina egna ämnesord
som i de flesta fall i etiketten verkar vara 1:1 med dem i svenska
ämnesord.

Mvh,

Peter

Martin Malmsten

unread,
Apr 3, 2009, 9:47:47 AM4/3/09
to ss...@googlegroups.com
Hallå,

nu finns en SPARQL-server med ett rudimentärt gränssnitt på http://lab3.libris.kb.se/sparql

Exempel:

---

select * where {
  ?s skos:prefLabel "Historia"@sv .
}
---

---

select * where {
  ?s foaf:name "August Strindberg" .
}
---

Trevlig helg!

mvh,
  Martin

Peter Krantz

unread,
Apr 3, 2009, 11:35:30 AM4/3/09
to ss...@googlegroups.com
Tjohoo! Här går det undan!

Vad blev det för motor till slut?

mvh,

Peter



2009/4/3 Martin Malmsten <martin....@kb.se>:
Reply all
Reply to author
Forward
0 new messages