Kurstips: Semantisk teknik i praktiken

Peter Krantz

unread,

Sep 7, 2010, 11:46:28 AM9/7/10

to ss...@googlegroups.com, Karl Wessbrandt, Anneli....@finance.ministry.se

Hej!

Detta kanske är ett tecken på att semwebområdet börjar bli mer
mainstream? Dataföreningen kompetens anordnar en 4-dagarskurs hur man
skapar ontologier i OWL/RDFS:

http://www.dfkompetens.se/it-utveckling/kurser/3110130/index.xml

Mvh,

Peter

Peter Neubauer

unread,

Sep 7, 2010, 2:18:53 PM9/7/10

to ss...@googlegroups.com

Coolt,
det verkar riktigt seriöst. Bra initiativ! Hoppas att de får bra intresse.

Cheers,

/peter neubauer

COO and Sales, Neo Technology

GTalk: neubauer.peter
Skype    peter.neubauer
Phone    +46 704 106975
LinkedIn   http://www.linkedin.com/in/neubauer
Twitter http://twitter.com/peterneubauer

http://www.neo4j.org - Your high performance graph database.
http://www.thoughtmade.com - Scandinavia's coolest Bring-a-Thing party.

2010/9/7 Peter Krantz <peter....@gmail.com>:

> --
> Det här meddelandet skickas till dig eftersom du prenumererar på gruppen SSWIG i Google Groups.
> Om du vill göra ett inlägg i den här gruppen skickar du e-post till ss...@googlegroups.com.
> Om du vill sluta prenumerera på den här gruppen skickar du e-post till sswig+un...@googlegroups.com.
> För fler alternativ, besök gruppen på http://groups.google.com/group/sswig?hl=sv.
>
>

Lundberg

unread,

Oct 6, 2010, 4:15:05 AM10/6/10

to SSWIG

Tyvärr ställdes kursen in. Jag var anmäld och fick denna förklaring
precis.

"...vi vill på detta sätt meddela att kursen dessvärre ställs in.
Anledningen är att vi inte fått tillräckligt med anmälda - och det är
inte troligt att vi gör ytterligare försök att starta kursen."

Det var lite trist måste jag säga.

/Johan

On Sep 7, 8:18 pm, Peter Neubauer <peter.neuba...@neotechnology.com>
wrote:

> Coolt,
> det verkar riktigt seriöst. Bra initiativ! Hoppas att de får bra intresse.
>
> Cheers,
>
> /peter neubauer
>
> COO and Sales, Neo Technology
>
> GTalk: neubauer.peter
> Skype    peter.neubauer
> Phone    +46 704 106975
> LinkedIn  http://www.linkedin.com/in/neubauer
> Twitter http://twitter.com/peterneubauer
>

> http://www.neo4j.org - Your high performance graph database.http://www.thoughtmade.com- Scandinavia's coolest Bring-a-Thing party.
>
> 2010/9/7 Peter Krantz <peter.kra...@gmail.com>:

Peter Krantz

unread,

Oct 6, 2010, 5:05:17 AM10/6/10

to ss...@googlegroups.com

2010/10/6 Lundberg <lundber...@gmail.com>:

> Tyvärr ställdes kursen in. Jag var anmäld och fick denna förklaring
> precis.

Ja, mycket trist. Jag är dock inte så förvånad eftersom det i
minerfarenhet är mycket få som arbetar med vokabulärer och
informationsmodeller "på riktigt". Just nu torrsimmar de flesta i UML
och har inte tänkt på hur man bygger återanvändbara modeller som
hänger ihop.

Mvh,

Peter

Stig Berild

unread,

Oct 7, 2010, 12:03:58 AM10/7/10

to ss...@googlegroups.com

Enligt min uppfattning ligger inte OWL/RDF i fas med tiden. När det gäller modellering räcker UML alldeles utmärkt i de allra flesta "vardagliga fall", alltså vid behovet av modeller "på riktigt". Därmed inte sagt att det är modellerarens dröm. Vill man koppla bort UMLs mer objektorienterade faciliteter, dvs fokusera mer på data än på process/funktion finns MOF, Stanli och diverse ER-modelleringsspråk tillgängliga att använda. De har under cirka 30-talet år genererat en bred skara användare för en stor uppsättning tillämpningsområden. Folk är helt enkelt nöjda. Ska OWL slå (RDF är för simpelt för att utgöra en konkurrent,det erbjuder ingenting mer än existerande språk) måste det inte bara erbjuda unika semantikrelaterade uttrycksmöjligheter, dessa faciliteter måste dessutom vara brett efterfrågade. Jag är ingen UML-fantast men har genom åren accepterat verkligheten, dvs att den "vardagliga världen" inte tjusas av nya språk eller faciliteter bara för att de är nya och kanske i något avseende "bättre". Verkligheten är mycket krasst behovsorienterad, tar hänsyn till existensen av tillgängliga verktyg - bred kompetens - tillgänglig service samt kräver integrerbarhet med övriga komponenter i en övergripande informationsarkitektur. Modellering måste kunna sättas "i produktion". Bland annat. Och tur är väl det förresten.

En annan anledning till att kursen inte genererade så stort intresse kan vara den illa formulerade inledningstexten. Att tala om behovet av att strukturera 15 petabyte information per dag är ju nästintill barockt i den mån man är seriöst intresserad av att utföra denna strukturering med semantik i tankarna. Alla som har arbetat med semantikfokuserad modellering (dvs begreppsmodellering) i reella projekt vet att det är ett mycket komplext och krävande arbete redan inom ett mycket begränsat tillämpningsområde. Det är praktiskt omöjligt att göra det med 15 petabyte som input - om det ska ske seriöst förstås. Dessutom finns ingen chans att anpassa sig till alla de nya omständigheter, uttrycksformer, tillämpningsfall, med mera som kontinuerligt ändrar skepnader. Googles chefsforskare Peter Norvig noterade redan vid Semantic Technology-konferensen 2005 att Google med sina analyserande algoritmer vid stora datamängder är helt överlägset strukturerad information i generering av mot informationsmassan svarande semantik. Han fick givetvis en del kritik för påståendet. Inte konstigt eftersom han vågade säga det vid en konferens enbart befolkad av deltagare uppfyllda av modeller och modellering. Men jag är övertygad om att han har rätt när det gäller dessa datamängder och givet information som inte specifikt kan preciseras till ett väldefinierat och stabilt informationsområde. Det har ännu större sanningshalt idag nu när bara Google analyserar nästan dubbelt så mycket information per dag (25-30 petabyte).

Därmed inte sagt att strukturerad information är "ute", tvärtom. Men det gäller att välja ett tillämpningsområde där modellering fungerar. Dessutom gäller det att, innan modellering startar, mycket välartikulerat och bland deltagare få accepterat vad det specifika syfte med modelleringen är. Det är kul att modellera, nästan beroendeframkallande, men i "verkligheten" är det knappast ett gångbart argument. I alla fall inte om utfallet ska falla uppdragsgivarna i smaken.

/Stig

2010/10/6 Peter Krantz <peter....@gmail.com>

Mvh,

Peter

--
Det här meddelandet skickas till dig eftersom du prenumererar på gruppen SSWIG i Google Groups.
Om du vill göra ett inlägg i den här gruppen skickar du e-post till ss...@googlegroups.com.
Om du vill sluta prenumerera på den här gruppen skickar du e-post till sswig+un...@googlegroups.com.

Eva Blomqvist

unread,

Oct 7, 2010, 3:41:26 AM10/7/10

to ss...@googlegroups.com

Hejsan, Stig och Peter!
Jag måste hålla med Peter när han skrev att det är "mycket få som arbetar med vokabulärer och
informationsmodeller "på riktigt"", med tillägget att detta gäller i Sverige. Jag känner inte till allt som händer inom industrin, men vad jag vet pågår det väldigt lite forskning inom semantic web i Sverige, jämfört hur stort det är på många andra ställen i Europa, och jag har inte stött på många företag inom Sveriges gränser som tar detta på allvar.

Delvis tror jag det beror på avsaknaden av avknoppade forskningsprojekt som blivit företag, det är i viss mån så semantiska teknologier blivit populära även ute i industrin i England och Spanien bland annat. De "forskningsrelaterade" företagen har visat vägen och tagit teknologin ut i industrin! Stora företag såsom Rollce Royce i England använder avancerad Information Extraction och ontologier för att strukturera underhållsinformation kring sina jetmotorer, vilket rör sig om datamängder i ordningen terabyte *per fysisk jetmotor*.

Google har alltid varit en stor motståndare till semantiska teknologier och ontologier, precis som du säger Stig. Naturligtvis är det så att Google fungerar, vi använder ju sökmotorn, eller hur!? Men Google har infört en paradigm där det är användaren som själv ska ta fram informationen man är ute efter. Sökmotorn är en datakälla, ett löpande band som levererar stora mängder grovt sorterad data. Sedan är det användaren som står för all analys och aggregering av data. Att denna paradigm har fått ett sådant starkt fäste är lite förvånande tycker jag. Google används ju inte bara som sökmotor på Internet, utan även för intranät inom företag, för att strukturera vetenskapliga publikationer osv. Det finns många fall där andra metoder och paradigmer kanske skulle fungera mycket bättre, men Googles totala dominans har gjort att den vanliga användaren har svårt att acceptera andra interaktionstyper. Det är synd. Genom sökmotorernas totala dominans har vi skapat ett Internet där en paradigm gäller och nu är det svårt att komma ur detta, eftersom användarna naturligtvis gillar det de är vana vid. Statistiska modeller behövs! Men det gör semantiska också, de ska bara användas för olika kompletterande use case.

När det gäller OWL/RDF som språk och vad det egentligen ska vara bra för. Tja, visst är RDF simpelt, men om ett simpelt format kan få folk att publicera data online på ett sätt så att de kan användas tillsammans och länkas ihop, då är mycket vunnet. Om du inte har kikat på initiativet med linked data så rekommenderar jag det varmt: http://linkeddata.org/
Redan genom att publicera denna datamängd öppnar man för mängder med nya applikationer, som inte var möjliga när vi bara hade "vanliga" webbsidor eller applikationsspecifika databaser att tillgå. Framför allt har det blivit *enkelt* att skapa dessa applikationer! Vem som helst kan skapa en egen liten iPhone app som använder geografiska data och mängder med andra data som inte fanns tillgängliga för 5 år sen. Detta har vi fått genom RDF!

Sedan håller jag med om att de verkligt stora förändringarna kommer när man använder ontologier (OWL) ovanpå data i RDF. För tillfället finns fortfarande forskningsproblem som gör detta problematiskt i vissa fall (egenheter i OWL, skalbarhet mm), men i mängder av fall skulle företag kunna ha stor nytta av att använda ontologier i sina produkter eller internt för sin informationsstruktur. Dit syftade ju även kursen som vi nu diskuterar. Ett av problemen som vi fortfarande måste komma över är att sluta se på ontologier som "abstrakta modeller", att jämställa med en ER-modell jag ritar i mitt kollegieblock. Om jag får lov att hårddra det lite skulle jag säga att OWL (med tillhörande regelspråk) är ett nytt programmeringsspråk, snarare än ett modelleringsspråk. Nu kan du lyfta ut en del av din programkod i en modell, som du kan uppdatera och ändra medan mjukvaran körs. Ett sorts "okompilerad kod" som gör din mjukvara otroligt mycket mer anpassningsbar och öppen för förändring än om allt kodas direkt i Java, eller vilket språk som nu används. Naturligtvis kan ontologier även användas som abstrakta "modeller av världen", men för företagen i industrin är det nog inte det som är det viktiga och som borde lyftas fram!

Mvh
Eva Blomqvist

Peter Neubauer

unread,

Oct 7, 2010, 4:01:00 AM10/7/10

to sswig

Eva,
jag älskar dina referenser till LinkedData, vilket jag är en stor fan
av. Samtidigt tror jag att det inte är bra att se OWL som ett
programmeringsspråk stället för ett schema. I praktiken finns det
redan många språk som man använder hellre (se alla skriptspråk) än
RDF- eller XML baserade dialekter som XQuery, XPath2, Jelly, Ant,
Maven etc etc. Nu pratar jag naturligtvis bara om
XML-representationen, men det krävs nog rätt mycket för att kunna
snacka om programmering i OWL och göra ett praktiskt värde uppenbart.

En kompis till mig har faktiskt byggt en Virtuell Maskin (Neno/Fhat)
och programmeringsspråk med typsäkerhet liknande Java i ren OWL och
RDF, supercoolt men inte praktiskt relevant, see

http://neno.lanl.gov/Blog/12E22C25-751F-4BE1-A916-F9BE68BDF067.html
http://arxiv.org/abs/0802.3492

Så jag tror att bör lyfta fram det praktiska värdet i att kunna
beskriva struktur i en ostrukturerad RDF-graf av triples med hjälp av
OWL, som sen ger hjälp till allt från verktyg för frågor,
programmering och validering av ändringar i datat. Jag är ingen expert
på RDF men jag håller med dig att mycket antagligen beror på hur man
skriver abstrakt till kursen och gör den praktiskt relevant.

Synd att det inte blir av!

Cheers,

/peter neubauer

VP Product Development, Neo Technology

GTalk: neubauer.peter
Skype    peter.neubauer
Phone    +46 704 106975
LinkedIn   http://www.linkedin.com/in/neubauer
Twitter http://twitter.com/peterneubauer

http://www.neo4j.org - Your high performance graph database.

http://www.thoughtmade.com - Scandinavia's coolest Bring-a-Thing party.

2010/10/7 Eva Blomqvist <evab...@gmail.com>:

Eva Blomqvist

unread,

Oct 7, 2010, 4:33:11 AM10/7/10

to ss...@googlegroups.com

Hej!
Jag h�ller absolut med dig, det jag skrev om OWL som ett
programmeringsspr�k var att h�rddra det hela, delvis f�r att jag ville
provocera lite... ;-)

Naturligtvis �r OWL till f�r modellering och inte till f�r att ers�tta
programmeringsspr�k! D�remot �r jag innerligt tr�tt p� de som ser
ontologier mestadels som ett sorts abstrakt modell av v�rlden, ist�llet
f�r ett konkret verktyg f�r att skapa en viss funktionalitet i en
programvara eller p� en webbsida etc.

H�lsn
Eva

On 7/10/10 10:01 , Peter Neubauer wrote:
> Eva,
> jag �lskar dina referenser till LinkedData, vilket jag �r en stor fan
> av. Samtidigt tror jag att det inte �r bra att se OWL som ett
> programmeringsspr�k st�llet f�r ett schema. I praktiken finns det
> redan m�nga spr�k som man anv�nder hellre (se alla skriptspr�k) �n

> RDF- eller XML baserade dialekter som XQuery, XPath2, Jelly, Ant,
> Maven etc etc. Nu pratar jag naturligtvis bara om

> XML-representationen, men det kr�vs nog r�tt mycket f�r att kunna
> snacka om programmering i OWL och g�ra ett praktiskt v�rde uppenbart.

>
> En kompis till mig har faktiskt byggt en Virtuell Maskin (Neno/Fhat)

> och programmeringsspr�k med typs�kerhet liknande Java i ren OWL och

> RDF, supercoolt men inte praktiskt relevant, see
>
> http://neno.lanl.gov/Blog/12E22C25-751F-4BE1-A916-F9BE68BDF067.html
> http://arxiv.org/abs/0802.3492
>

> S� jag tror att b�r lyfta fram det praktiska v�rdet i att kunna
> beskriva struktur i en ostrukturerad RDF-graf av triples med hj�lp av
> OWL, som sen ger hj�lp till allt fr�n verktyg f�r fr�gor,
> programmering och validering av �ndringar i datat. Jag �r ingen expert
> p� RDF men jag h�ller med dig att mycket antagligen beror p� hur man
> skriver abstrakt till kursen och g�r den praktiskt relevant.

>
> Synd att det inte blir av!
>
> Cheers,
>
> /peter neubauer
>
> VP Product Development, Neo Technology
>
> GTalk: neubauer.peter
> Skype peter.neubauer
> Phone +46 704 106975
> LinkedIn http://www.linkedin.com/in/neubauer
> Twitter http://twitter.com/peterneubauer
>
> http://www.neo4j.org - Your high performance graph database.
> http://www.thoughtmade.com - Scandinavia's coolest Bring-a-Thing party.
>
>
>
> 2010/10/7 Eva Blomqvist<evab...@gmail.com>:
>> Hejsan, Stig och Peter!

>> Jag m�ste h�lla med Peter n�r han skrev att det �r "mycket f� som arbetar
>> med vokabul�rer och
>> informationsmodeller "p� riktigt"", med till�gget att detta g�ller i
>> Sverige. Jag k�nner inte till allt som h�nder inom industrin, men vad jag
>> vet p�g�r det v�ldigt lite forskning inom semantic web i Sverige, j�mf�rt
>> hur stort det �r p� m�nga andra st�llen i Europa, och jag har inte st�tt p�
>> m�nga f�retag inom Sveriges gr�nser som tar detta p� allvar.
>>
>> Delvis tror jag det beror p� avsaknaden av avknoppade forskningsprojekt som
>> blivit f�retag, det �r i viss m�n s� semantiska teknologier blivit popul�ra
>> �ven ute i industrin i England och Spanien bland annat. De
>> "forskningsrelaterade" f�retagen har visat v�gen och tagit teknologin ut i
>> industrin! Stora f�retag s�som Rollce Royce i England anv�nder avancerad
>> Information Extraction och ontologier f�r att strukturera
>> underh�llsinformation kring sina jetmotorer, vilket r�r sig om datam�ngder i

>> ordningen terabyte *per fysisk jetmotor*.
>>

>> Google har alltid varit en stor motst�ndare till semantiska teknologier och
>> ontologier, precis som du s�ger Stig. Naturligtvis �r det s� att Google
>> fungerar, vi anv�nder ju s�kmotorn, eller hur!? Men Google har inf�rt en
>> paradigm d�r det �r anv�ndaren som sj�lv ska ta fram informationen man �r
>> ute efter. S�kmotorn �r en datak�lla, ett l�pande band som levererar stora
>> m�ngder grovt sorterad data. Sedan �r det anv�ndaren som st�r f�r all analys
>> och aggregering av data. Att denna paradigm har f�tt ett s�dant starkt f�ste
>> �r lite f�rv�nande tycker jag. Google anv�nds ju inte bara som s�kmotor p�
>> Internet, utan �ven f�r intran�t inom f�retag, f�r att strukturera
>> vetenskapliga publikationer osv. Det finns m�nga fall d�r andra metoder och
>> paradigmer kanske skulle fungera mycket b�ttre, men Googles totala dominans
>> har gjort att den vanliga anv�ndaren har sv�rt att acceptera andra
>> interaktionstyper. Det �r synd. Genom s�kmotorernas totala dominans har vi
>> skapat ett Internet d�r en paradigm g�ller och nu �r det sv�rt att komma ur
>> detta, eftersom anv�ndarna naturligtvis gillar det de �r vana vid.
>> Statistiska modeller beh�vs! Men det g�r semantiska ocks�, de ska bara
>> anv�ndas f�r olika kompletterande use case.
>>
>> N�r det g�ller OWL/RDF som spr�k och vad det egentligen ska vara bra f�r.
>> Tja, visst �r RDF simpelt, men om ett simpelt format kan f� folk att
>> publicera data online p� ett s�tt s� att de kan anv�ndas tillsammans och
>> l�nkas ihop, d� �r mycket vunnet. Om du inte har kikat p� initiativet med
>> linked data s� rekommenderar jag det varmt: http://linkeddata.org/
>> Redan genom att publicera denna datam�ngd �ppnar man f�r m�ngder med nya
>> applikationer, som inte var m�jliga n�r vi bara hade "vanliga" webbsidor
>> eller applikationsspecifika databaser att tillg�. Framf�r allt har det

>> blivit *enkelt* att skapa dessa applikationer! Vem som helst kan skapa en

>> egen liten iPhone app som anv�nder geografiska data och m�ngder med andra
>> data som inte fanns tillg�ngliga f�r 5 �r sen. Detta har vi f�tt genom RDF!
>>
>> Sedan h�ller jag med om att de verkligt stora f�r�ndringarna kommer n�r man
>> anv�nder ontologier (OWL) ovanp� data i RDF. F�r tillf�llet finns
>> fortfarande forskningsproblem som g�r detta problematiskt i vissa fall
>> (egenheter i OWL, skalbarhet mm), men i m�ngder av fall skulle f�retag kunna
>> ha stor nytta av att anv�nda ontologier i sina produkter eller internt f�r
>> sin informationsstruktur. Dit syftade ju �ven kursen som vi nu diskuterar.
>> Ett av problemen som vi fortfarande m�ste komma �ver �r att sluta se p�
>> ontologier som "abstrakta modeller", att j�mst�lla med en ER-modell jag
>> ritar i mitt kollegieblock. Om jag f�r lov att h�rddra det lite skulle jag
>> s�ga att OWL (med tillh�rande regelspr�k) �r ett nytt programmeringsspr�k,
>> snarare �n ett modelleringsspr�k. Nu kan du lyfta ut en del av din
>> programkod i en modell, som du kan uppdatera och �ndra medan mjukvaran k�rs.
>> Ett sorts "okompilerad kod" som g�r din mjukvara otroligt mycket mer
>> anpassningsbar och �ppen f�r f�r�ndring �n om allt kodas direkt i Java,
>> eller vilket spr�k som nu anv�nds. Naturligtvis kan ontologier �ven anv�ndas
>> som abstrakta "modeller av v�rlden", men f�r f�retagen i industrin �r det
>> nog inte det som �r det viktiga och som borde lyftas fram!

>>
>> Mvh
>> Eva Blomqvist
>>
>> On 7/10/10 06:03 , Stig Berild wrote:
>>

>> Enligt min uppfattning ligger inte OWL/RDF i fas med tiden. N�r det g�ller
>> modellering r�cker UML alldeles utm�rkt i de allra flesta "vardagliga fall",
>> allts� vid behovet av modeller "p� riktigt". D�rmed inte sagt att det �r
>> modellerarens dr�m. Vill man koppla bort UMLs mer objektorienterade
>> faciliteter, dvs fokusera mer p� data �n p� process/funktion finns MOF,
>> Stanli och diverse ER-modelleringsspr�k tillg�ngliga att anv�nda. De har
>> under cirka 30-talet �r genererat en bred skara anv�ndare f�r en stor
>> upps�ttning till�mpningsomr�den. Folk �r helt enkelt n�jda. Ska OWL sl� (RDF
>> �r f�r simpelt f�r att utg�ra en konkurrent,det erbjuder ingenting mer �n
>> existerande spr�k) m�ste det inte bara erbjuda unika semantikrelaterade
>> uttrycksm�jligheter, dessa faciliteter m�ste dessutom vara brett
>> efterfr�gade. Jag �r ingen UML-fantast men har genom �ren accepterat
>> verkligheten, dvs att den "vardagliga v�rlden" inte tjusas av nya spr�k
>> eller faciliteter bara f�r att de �r nya och kanske i n�got avseende
>> "b�ttre". Verkligheten �r mycket krasst behovsorienterad, tar h�nsyn till
>> existensen av tillg�ngliga verktyg - bred kompetens - tillg�nglig service
>> samt kr�ver integrerbarhet med �vriga komponenter i en �vergripande
>> informationsarkitektur. Modellering m�ste kunna s�ttas "i produktion". Bland
>> annat. Och tur �r v�l det f�rresten.
>>
>> En annan anledning till att kursen inte genererade s� stort intresse kan

>> vara den illa formulerade inledningstexten. Att tala om behovet av att

>> strukturera 15 petabyte information per dag �r ju n�stintill barockt i den
>> m�n man �r seri�st intresserad av att utf�ra denna strukturering med

>> semantik i tankarna. Alla som har arbetat med semantikfokuserad modellering

>> (dvs begreppsmodellering) i reella projekt vet att det �r ett mycket
>> komplext och kr�vande arbete redan inom ett mycket begr�nsat
>> till�mpningsomr�de. Det �r praktiskt om�jligt att g�ra det med 15 petabyte
>> som input - om det ska ske seri�st f�rst�s. Dessutom finns ingen chans att
>> anpassa sig till alla de nya omst�ndigheter, uttrycksformer,
>> till�mpningsfall, med mera som kontinuerligt �ndrar skepnader. Googles

>> chefsforskare Peter Norvig noterade redan vid Semantic
>> Technology-konferensen 2005 att Google med sina analyserande algoritmer vid

>> stora datam�ngder �r helt �verl�gset strukturerad information i generering

>> av mot informationsmassan svarande semantik. Han fick givetvis en del kritik

>> f�r p�st�endet. Inte konstigt eftersom han v�gade s�ga det vid en konferens

>> enbart befolkad av deltagare uppfyllda av modeller och modellering. Men jag

>> �r �vertygad om att han har r�tt n�r det g�ller dessa datam�ngder och givet
>> information som inte specifikt kan preciseras till ett v�ldefinierat och
>> stabilt informationsomr�de. Det har �nnu st�rre sanningshalt idag nu n�r
>> bara Google analyserar n�stan dubbelt s� mycket information per dag (25-30
>> petabyte).
>>
>> D�rmed inte sagt att strukturerad information �r "ute", tv�rtom. Men det
>> g�ller att v�lja ett till�mpningsomr�de d�r modellering fungerar. Dessutom
>> g�ller det att, innan modellering startar, mycket v�lartikulerat och bland
>> deltagare f� accepterat vad det specifika syfte med modelleringen �r. Det �r
>> kul att modellera, n�stan beroendeframkallande, men i "verkligheten" �r det
>> knappast ett g�ngbart argument. I alla fall inte om utfallet ska falla

>> uppdragsgivarna i smaken.
>>
>> /Stig
>>
>>
>>
>> 2010/10/6 Peter Krantz<peter....@gmail.com>
>>> 2010/10/6 Lundberg<lundber...@gmail.com>:

>>>> Tyv�rr st�lldes kursen in. Jag var anm�ld och fick denna f�rklaring
>>>> precis.
>>> Ja, mycket trist. Jag �r dock inte s� f�rv�nad eftersom det i
>>> minerfarenhet �r mycket f� som arbetar med vokabul�rer och
>>> informationsmodeller "p� riktigt". Just nu torrsimmar de flesta i UML
>>> och har inte t�nkt p� hur man bygger �teranv�ndbara modeller som
>>> h�nger ihop.
>>>
>>> Mvh,
>>>
>>> Peter
>>>
>>> --
>>> Det h�r meddelandet skickas till dig eftersom du prenumererar p� gruppen
>>> SSWIG i Google Groups.
>>> Om du vill g�ra ett inl�gg i den h�r gruppen skickar du e-post till
>>> ss...@googlegroups.com.
>>> Om du vill sluta prenumerera p� den h�r gruppen skickar du e-post till
>>> sswig+un...@googlegroups.com.
>>> F�r fler alternativ, bes�k gruppen p�
>>> http://groups.google.com/group/sswig?hl=sv.
>>>
>> --
>> Det h�r meddelandet skickas till dig eftersom du prenumererar p� gruppen
>> SSWIG i Google Groups.
>> Om du vill g�ra ett inl�gg i den h�r gruppen skickar du e-post till
>> ss...@googlegroups.com.
>> Om du vill sluta prenumerera p� den h�r gruppen skickar du e-post till
>> sswig+un...@googlegroups.com.
>> F�r fler alternativ, bes�k gruppen p�
>> http://groups.google.com/group/sswig?hl=sv.
>>
>> --
>> Det h�r meddelandet skickas till dig eftersom du prenumererar p� gruppen
>> SSWIG i Google Groups.
>> Om du vill g�ra ett inl�gg i den h�r gruppen skickar du e-post till
>> ss...@googlegroups.com.
>> Om du vill sluta prenumerera p� den h�r gruppen skickar du e-post till
>> sswig+un...@googlegroups.com.
>> F�r fler alternativ, bes�k gruppen p�
>> http://groups.google.com/group/sswig?hl=sv.
>>

Eva Blomqvist

unread,

Oct 7, 2010, 5:02:21 AM10/7/10

to ss...@googlegroups.com

Hej!
Som jag skrev i mitt andra (n�got provokativa) inl�gg s� har jag
egentligen inte s� bra koll p� vilken forskning och utveckling inom
semantiska teknologier, semantic web mm, som p�g�r i Sverige just nu.
Sj�lv doktorerade jag inom ontology engineering (urs�kta svengelskan) i
b�rjan av 2009 och har sedan dess jobbat p� ett Italienskt
forskningsinstitut i Rom. Nu �r jag nyss hemkommen till J�nk�ping och
JTH igen, s� det hade varit kul att h�ra lite om vad som p�g�r i Sverige
just nu!

N�gra intressanta forskningsprojekt att kolla n�rmare p�? Vad h�ller
f�retagen p� med? Publiceras n�gon svensk linked data? N�gra h�ftiga
applikationer att ta upp som goda exempel p� "svensk semantic web"?

H�lsn
Eva Blomqvist
Tf. Universitetslektor,
Tekniska h�gskolan i J�nk�ping

Staffan Malmgren

unread,

Oct 7, 2010, 6:15:01 AM10/7/10

to ss...@googlegroups.com

Hej,

Jag tutar gärna i egen lur för det arbete med svensk rättsinformation som jag är inblandad i (vilket även Niklas Lindström på listan är, och Peter Krantz var tidigare projektledare för detsamma). Vi har definerat en vokabulär med RDFS/OWL som beskriver olika typer av rättsinformationsdokument (lagar, rättsfall, förarbeten, myndighetsföreskrifter m.m.), deras egenskaper och olika typer av juridiskt betydelsefulla relationer mellan dessa. Det finns ca 100 myndigheter som producerar sådan rättsinformation, och varje myndighet ska publicera RDF-data för sina dokument. Informationen blir sedan tillgänglig som linked data i ett centralt datalager. "Min" myndighet (Domstolsverket) har samordningsansvar för det hela. Projektet är väl inte direkt forskningsinriktat (det syftar till att göra rättsinformationen bättre tillgänglig för enskilda och förvaltningen) men det finns en hel del aspekter av det som kan vara intressant från semwebforskning (allt ifrån en RDF-driven modell för att mynta URI:er utifrån RDF-data om själva resursen till mekanismer för att distribuerat propagera ändringar i en stor RDF-graf).

Projektet finns kortfattat beskrivet i e-delegationens nyutkommna betänkande (SOU 2010:62, http://www.edelegationen.se/betankande/sa-enkelt-som-mojligt-for-sa-manga-som-mojligt-0, på sidan 205 och framåt), och mer detaljerad information (inklusive den definerade vokabulären i RDF/XML och HTML) finns på http://dev.lagrummet.se/dokumentation/. Än så länge är det bara ett fåtal myndigheter som kommit så långt att de kan publicera någon riktig RDF-data, men vi har testkört systemet med simulerad data om ca 30 000 dokument och inbördes relationer mellan dessa.

mvh

/Staffan

2010/10/7 Eva Blomqvist <evab...@gmail.com>

Hej!
Som jag skrev i mitt andra (något provokativa) inlägg så har jag egentligen inte så bra koll på vilken forskning och utveckling inom semantiska teknologier, semantic web mm, som pågår i Sverige just nu. Själv doktorerade jag inom ontology engineering (ursäkta svengelskan) i början av 2009 och har sedan dess jobbat på ett Italienskt forskningsinstitut i Rom. Nu är jag nyss hemkommen till Jönköping och JTH igen, så det hade varit kul att höra lite om vad som pågår i Sverige just nu!

Några intressanta forskningsprojekt att kolla närmare på? Vad håller företagen på med? Publiceras någon svensk linked data? Några häftiga applikationer att ta upp som goda exempel på "svensk semantic web"?

Hälsn
Eva Blomqvist
Tf. Universitetslektor,
Tekniska högskolan i Jönköping

--
Det här meddelandet skickas till dig eftersom du prenumererar på gruppen SSWIG i Google Groups.
Om du vill göra ett inlägg i den här gruppen skickar du e-post till ss...@googlegroups.com.
Om du vill sluta prenumerera på den här gruppen skickar du e-post till sswig+un...@googlegroups.com.

Egon Willighagen

unread,

Oct 7, 2010, 5:07:53 AM10/7/10

to ss...@googlegroups.com

Dear Eva,

(I'm not fluent in Swedish, so please forgive me my English...)

2010/10/7 Eva Blomqvist <evab...@gmail.com>:

> Några intressanta forskningsprojekt att kolla närmare på? Vad håller
> företagen på med? Publiceras någon svensk linked data? Några häftiga
> applikationer att ta upp som goda exempel på "svensk semantic web"?

My group [0] has been working on using semantic web technologies in
life sciences.
For example:

http://chem-bla-ics.blogspot.com/2010/02/chembl-rdf-1sparql-end-point.html
http://chembl.blogspot.com/2010/08/from-one-of-our-collaborators.html
http://saml.rilspace.org/editing-semantic-mediawiki-from-bioclipse-with-screencast

So, the data itself is not Svensk, the hosting is :)

Kind regards,

Egon

0.subgroup of group of Prof. Wikberg, Uppsala University

--
Dr E.L. Willighagen
Homepage: http://egonw.github.com/
LinkedIn: http://se.linkedin.com/in/egonw
Blog: http://chem-bla-ics.blogspot.com/
PubList: http://www.citeulike.org/user/egonw/tag/papers

Samuel Lampa

unread,

Oct 7, 2010, 5:23:14 AM10/7/10

to ss...@googlegroups.com

T�nkte skicka en of�rsk�md "plug" om den semantic web funktionalitet
som finns/utvecklas i det (huvudsakligen svenskutvecklade)
forskningsverktyget Bioclipse [1].

Egon Willighagen, som �r maintaner f�r Bioclipse's RDF modul, har t.ex.
bloggat en hel del om anv�ndning av linked data inom kemoinformatik
(t.ex. [2] och [3]).

Ett projekt som jag sj�lv jobbar p� tillsammans med Egon, och som jag
tycker �r en r�t "h�ftig applikation" :) ... �r att koppla ihop
Bioclipse med Semantic MediaWiki [4], f�r att kunna exportera ut
"arbetsdata" fr�n Bioclipse till en semantiskt annoterad wiki, d�r flera
forkare kan "kollaborera" med att kurera/redigera datat, varefter man
kan importera det i Bioclipse igen. Jag tyckte Egon srev en bra
sammanfattning p� [5], och jag har sj�lv bloggat och demonstrerat med
screencast p� [6].

[1] http://www.bioclipse.net
[2]
http://chem-bla-ics.blogspot.com/2010/05/my-opentox-workshop-contribution.html

[3]
http://chem-bla-ics.blogspot.com/2010/08/first-acsboston-talk-linking-rdf-to.html

[4] http://semantic-mediawiki.org/wiki/
[6]
http://saml.rilspace.org/editing-semantic-mediawiki-from-bioclipse-with-screencast

Mvh
// Samuel

--
Samuel Lampa
---------------------------------------
Student @ Uppsala University
---------------------------------------
Blog: http://saml.rilspace.org
---------------------------------------

Samuel Lampa

unread,

Oct 7, 2010, 9:40:15 AM10/7/10

to ss...@googlegroups.com

Oh, sorry all for multi-posting!

(There is obviously some delay on the list, as I didn't see Egon's
message until now ...)

// Samuel

On 10/07/2010 11:07 AM, Egon Willighagen wrote:
> Dear Eva,
>
> (I'm not fluent in Swedish, so please forgive me my English...)
>
> 2010/10/7 Eva Blomqvist<evab...@gmail.com>:

>> N�gra intressanta forskningsprojekt att kolla n�rmare p�? Vad h�ller
>> f�retagen p� med? Publiceras n�gon svensk linked data? N�gra h�ftiga

>> applikationer att ta upp som goda exempel p� "svensk semantic web"?

Stig Berild

unread,

Oct 7, 2010, 8:03:59 PM10/7/10

to ss...@googlegroups.com

Trevliga diskussioner!

Fortsätter lite fräckt med några kommentarer till Evas mail:

* Det finns knappast något projekt som berör informationshantering i någon form (lagring, utbyte, ....) eller begreppsutveckling som inte använder sig av modellering "på riktigt" som stödjande verktyg. Det är heller inget nytt. Modellering har tillämpats under många år inom en mängd olika tillämpningsområden och med olika syften (begrepps-, informations-, data- och processmodellering). Däremot är det förmodligen sant att säga att tillämpning med mer direkta SW-förtecken har varit betydligt mer begränsad. SW-tillämpningar berör och relaterar (min tolkning) huvudsakligen resurser/artefakter på nätet. I alla fall var det upprinnelsen för RDF. Tillämpningarna kännetecknas ofta av mer eller mindre globala resursvärldar, inte minst med tanke på det frekventa utnyttjandet av URIer som representation. Utöver detta är det inte så mycket som skiljer. Med hjälp av de flesta modelleringsspråk kan modeller för såväl konventionella som SW-tillämpningar uttryckas. SW är ett av många tillämpningsområden där information fångas in i modeller.

* Inget fel på referensen till Rolls Royce. Dock; de flesta (alla?) industriföretag utnyttjar produktmodeller och har så gjort länge. Hur skulle de annars kunna producera, vidareutveckla, felanalysera, mm sina avancerade produkter? Det finns en mycket spridd och synnerligen komplex men samtidigt flexibel ISO-standard med vars hjälp produktinformation kan modelleras: Product Life Cycle Support, PLCS, (ISO 10303-239). Notera speciellt att modellen syftar till att stödja en produkts hela livscykel. PLCS är i sin senaste version från 2005. Den ingår i en omfattande samling ISO-standarder som går under den gemensamma förkortningen STEP (Standard for the Exchange of Product model data). PLCS är uttryckt i modelleringsspråket EXPRESS, ett språk som funnits "i alla tider". EXPRESS är ockå en ISO-standard (ISO 10303-11) som ingår i STEP. Det finns en hel del (kritiskt) att säga om EXPRESS men språket fungerar trots det tydligen utmärkt för sitt avancerade ändamål. Inte mycket specifikt SW men väldigt mycket modeller och modellering.

* Detta om Google. Visst är det så att Google inte alltid ger den service vi önskar och heller inte den precision vi efterlängtar. Men nog erbjuder Google väldigt trevlig och användbar filtrering och allt bättre träffsäkerhet. Är övertygad om att deras motor vid sökning använder sig av allt som står i dess förmåga för att erbjuda attraktiv service, både med hjälp av statistiska modeller och andra finesser. Vågar påstå detta eftersom Peter Norvig, som jag nämnde i tidigare mail, inte är någon statistiker utan en av de mest respekterade och en av de absolut främsta förgrundsfigurerna inom artificiell Intelligens-området sedan många år. Ett exempel på finess är till exempel det nyligen annonserade "Google Instant". Återigen; kanske är inte det Google erbjuder alltid mitt i prick för den som kräver perfekta resultat men vad är alternativet givet dessa 20-30 petabyte vi tidigare pratade om. Vem orkar lägga ett välstrukturerat semantiskt raster ovanför denna informationsmassa. Vem har denna gudomliga förmåga att tolka in informationen i rastret? Vet att det finns personer som anser att det finns neutralt giltiga fakta och sanningar om och ikring den värld vi lever i och att det därför går att formulera en allom giltig - eventuellt några stycken - informationsmodeller för att fånga detta. Och väl där är semantiken infångad för alltid. Kanske inte för allt här i världen men för många av de verkligheter vi har omkring oss. Jag har en betydligt mer torftig syn på det hela. Jag tror att det går att avgränsa "verkligheten" (inklusive det immateriella, tänkande, mm abstrakt) på tusen och en olika sätt, att det dessutom går att ha en väldig mängd olika infallsvinklar på en och samma avgränsade verklighet, dessutom med för varje sådan infallsvinkel ett antal olika möjliga syften. Lägg till detta att varje modellerare eller modelleringsgrupp i sitt arbete har att utgå ifrån sin egen personlighet, kunskapsbas, kulturella hemvist med mera, dvs. diverse bakgrund som också "färgar" arbetet och slutresultatet. Det finns förresten många vittnesmål om modelleringar inom ett och samma företag eller till och med visst affärsområde inom företag där man gått på en "mina", dvs. inte kunnat komma fram till en gemensamt överenskommen modell för något visst ändamål just på grund av alla dessa bakomliggande faktorer. Faktorerna är förstås lika giltiga när det gäller resurser, alster, artefakter på nätet.

* Jag menade inte att kritisera RDF för sin enkelhet, bara att notera att RDF inte är något nytt. Binära modelleringsspråk har funnits i flera decennier och över hela denna tid kommit till omfattande användning. Jag använder det själv flitigt, gärna med den påbyggnad som Stanli-språket erbjuder. Det lite speciella med RDF är alltså inte uttryckskraften med språket utan det tillämpningsområde som det normalt relateras till, nämligen dessa alster på nätet och därmed till användning av URIer som representanter för det som tripplerna "pratar om". Inget fel i det, tillämpningsområdet är spännande. URIer behövs där. Är däremot tveksam till den överanvändning som jag ser exempel på och som i viss mån har att göra med min ovan beskrivna "torftiga" syn på modellering och dess tillämpning.

För att till sist spetsa till det lite tror jag inte som en generell lösning på de relateringar mellan olika modellvärldar som föreslås i en tutorial refererad från linkeddata.org. Ett exempel beskriver Oscarsvinnare respektive skådespelare. Exemplet i sig är väl inte så tokigt som pedagogisk beskrivning av vad det hela går ut på men extrapolering av resonemanget till flera mer eller mindre lierade modellvärldar kommer inte att fungera i praktiken, utom i mycket specifika fall med given integreringspotential. Enligt min syn på det hela i alla fall. (Obs, med modellvärld menar jag informationsmängd strukturerad i enlighet med viss informationsmodell, inte viss databas. Det kan av olika skäl finnas en mängd olika fysiska databaser som alla tillämpar samma modell. Dessa databaser ingår alla i samma modellvärld.)

Allt för nu
Stig

2010/10/7 Eva Blomqvist <evab...@gmail.com>

Stig Berild

unread,

Oct 7, 2010, 11:50:43 PM10/7/10

to ss...@googlegroups.com

Passar på och kommenterar detta också, nu när jag ändå håller på.

Är för egen del inte alls trött på modeller som abstraktioner av världen. Vi behöver dessa modeller till allt möjligt, både för att kunna hantera information om en intressant värld (lagra, utbyta, ...) och för att bättre förstå den semantik som ligger bakom det språkbruk som tillämpas inom ett visst tillämpningsområde. Bland annat. Det finns ingen funktionalitet att abstrahera och det ska heller inte finnas. Informationen försöker ge en bild av en "verklighet". Aktuell, historisk, framtidsinriktad, ...... Här fungerar de flesta modelleringsspråk.

Sedan finns det behov av att skapa nya dynamiska verkligheter, att försöka efterlikna dynamiken i existerande verkligheter för att den vägen kunna generera fram intressant information, öka förståelse och så vidare. I det senare fallet brukar man tala om simuleringar. Det sker genom programkod och allra helst med hjälp av ett programmeringsspråk som erbjuder önskad uttryckskraft och faciliteter som i möjligaste mån kan skapa de typer av företeelser man vill se i denna dynamiska värld. De objektorienterade språken har tillkommit för detta ändamål. Vilket som är bäst är en smaksak. Själv programmerade jag en hel del i Simula på 70-talet innan det språket slutade stödjas (ingen fortsatt kompilatorutveckling t.ex.). Synd eftersom det var det första riktiga objektorienterade språket. Dessutom alldeles utmärkt för sitt ändamål. Klockrent!

Det är alltså viktigt att skilja på dessa olika förutsättningar, representationen av ett tillstånd för en existerande verklighet och formulering av dynamiska digitala verkligheter (nya eller avbildande). Det kan vara allt ifrån de spelvärldar som Playstation 3 erbjuder till mer konventionella tillämpningar som grafiska gränssnitt, Protegé, webbgränssnitt och allt annat. De behöver olika språk för att kunna uttryckas.

Det är för övrigt något många har missat när de använder UML, som ju kan beskriva såväl information som beteende/dynamik. Man modellerar ofta tillståndsmodeller men lägger ändå in beteende i de objekt som modelleras. Eftersom objekten i sig inte har något beteende anger man istället beteende för den funktionalitet som opererar på modellerna, dvs funktionalitet i det verktyg som tillämpas för hantering av modellerna (exv store, delete, check, ...). Ute och cyklar är man då.

Så är denna värld. Kanske inte dumt med en portion forskning som reder ut "begreppen", ser till att diverse flum förpassas till cylinderarkivet samt lägger en hållfast agenda mot framtiden.

Vi har chansen i Sverige eftersom vi har en ovanligt lång modelleringshistoria att falla tillbaka på.

Dags för lite sömn här borta i Silicon Valley

Stig

2010/10/7 Eva Blomqvist <evab...@gmail.com>

Hej!
Jag håller absolut med dig, det jag skrev om OWL som ett programmeringsspråk var att hårddra det hela, delvis för att jag ville provocera lite... ;-)

Naturligtvis är OWL till för modellering och inte till för att ersätta programmeringsspråk! Däremot är jag innerligt trött på de som ser ontologier mestadels som ett sorts abstrakt modell av världen, istället för ett konkret verktyg för att skapa en viss funktionalitet i en programvara eller på en webbsida etc.

Hälsn
Eva

On 7/10/10 10:01 , Peter Neubauer wrote:

Eva,

jag älskar dina referenser till LinkedData, vilket jag är en stor fan
av. Samtidigt tror jag att det inte är bra att se OWL som ett
programmeringsspråk stället för ett schema. I praktiken finns det
redan många språk som man använder hellre (se alla skriptspråk) än

RDF- eller XML baserade dialekter som XQuery, XPath2, Jelly, Ant,
Maven etc etc. Nu pratar jag naturligtvis bara om

XML-representationen, men det krävs nog rätt mycket för att kunna
snacka om programmering i OWL och göra ett praktiskt värde uppenbart.

En kompis till mig har faktiskt byggt en Virtuell Maskin (Neno/Fhat)

och programmeringsspråk med typsäkerhet liknande Java i ren OWL och

RDF, supercoolt men inte praktiskt relevant, see

http://neno.lanl.gov/Blog/12E22C25-751F-4BE1-A916-F9BE68BDF067.html
http://arxiv.org/abs/0802.3492

Så jag tror att bör lyfta fram det praktiska värdet i att kunna
beskriva struktur i en ostrukturerad RDF-graf av triples med hjälp av
OWL, som sen ger hjälp till allt från verktyg för frågor,
programmering och validering av ändringar i datat. Jag är ingen expert

på RDF men jag håller med dig att mycket antagligen beror på hur man
skriver abstrakt till kursen och gör den praktiskt relevant.

Synd att det inte blir av!

Cheers,

/peter neubauer

VP Product Development, Neo Technology

GTalk: neubauer.peter
Skype peter.neubauer
Phone +46 704 106975
LinkedIn http://www.linkedin.com/in/neubauer
Twitter http://twitter.com/peterneubauer

http://www.neo4j.org - Your high performance graph database.
http://www.thoughtmade.com - Scandinavia's coolest Bring-a-Thing party.

2010/10/7 Eva Blomqvist<evab...@gmail.com>:

Hejsan, Stig och Peter!

Jag måste hålla med Peter när han skrev att det är "mycket få som arbetar
med vokabulärer och
informationsmodeller "på riktigt"", med tillägget att detta gäller i
Sverige. Jag känner inte till allt som händer inom industrin, men vad jag
vet pågår det väldigt lite forskning inom semantic web i Sverige, jämfört
hur stort det är på många andra ställen i Europa, och jag har inte stött på
många företag inom Sveriges gränser som tar detta på allvar.

Delvis tror jag det beror på avsaknaden av avknoppade forskningsprojekt som
blivit företag, det är i viss mån så semantiska teknologier blivit populära
även ute i industrin i England och Spanien bland annat. De
"forskningsrelaterade" företagen har visat vägen och tagit teknologin ut i
industrin! Stora företag såsom Rollce Royce i England använder avancerad
Information Extraction och ontologier för att strukturera

underhållsinformation kring sina jetmotorer, vilket rör sig om datamängder i

ordningen terabyte *per fysisk jetmotor*.

Google har alltid varit en stor motståndare till semantiska teknologier och
ontologier, precis som du säger Stig. Naturligtvis är det så att Google
fungerar, vi använder ju sökmotorn, eller hur!? Men Google har infört en
paradigm där det är användaren som själv ska ta fram informationen man är
ute efter. Sökmotorn är en datakälla, ett löpande band som levererar stora
mängder grovt sorterad data. Sedan är det användaren som står för all analys
och aggregering av data. Att denna paradigm har fått ett sådant starkt fäste
är lite förvånande tycker jag. Google används ju inte bara som sökmotor på
Internet, utan även för intranät inom företag, för att strukturera
vetenskapliga publikationer osv. Det finns många fall där andra metoder och
paradigmer kanske skulle fungera mycket bättre, men Googles totala dominans
har gjort att den vanliga användaren har svårt att acceptera andra
interaktionstyper. Det är synd. Genom sökmotorernas totala dominans har vi
skapat ett Internet där en paradigm gäller och nu är det svårt att komma ur
detta, eftersom användarna naturligtvis gillar det de är vana vid.
Statistiska modeller behövs! Men det gör semantiska också, de ska bara
användas för olika kompletterande use case.

När det gäller OWL/RDF som språk och vad det egentligen ska vara bra för.
Tja, visst är RDF simpelt, men om ett simpelt format kan få folk att
publicera data online på ett sätt så att de kan användas tillsammans och
länkas ihop, då är mycket vunnet. Om du inte har kikat på initiativet med
linked data så rekommenderar jag det varmt: http://linkeddata.org/

Redan genom att publicera denna datamängd öppnar man för mängder med nya
applikationer, som inte var möjliga när vi bara hade "vanliga" webbsidor
eller applikationsspecifika databaser att tillgå. Framför allt har det

blivit *enkelt* att skapa dessa applikationer! Vem som helst kan skapa en

egen liten iPhone app som använder geografiska data och mängder med andra
data som inte fanns tillgängliga för 5 år sen. Detta har vi fått genom RDF!

Sedan håller jag med om att de verkligt stora förändringarna kommer när man
använder ontologier (OWL) ovanpå data i RDF. För tillfället finns
fortfarande forskningsproblem som gör detta problematiskt i vissa fall
(egenheter i OWL, skalbarhet mm), men i mängder av fall skulle företag kunna
ha stor nytta av att använda ontologier i sina produkter eller internt för
sin informationsstruktur. Dit syftade ju även kursen som vi nu diskuterar.
Ett av problemen som vi fortfarande måste komma över är att sluta se på
ontologier som "abstrakta modeller", att jämställa med en ER-modell jag
ritar i mitt kollegieblock. Om jag får lov att hårddra det lite skulle jag
säga att OWL (med tillhörande regelspråk) är ett nytt programmeringsspråk,
snarare än ett modelleringsspråk. Nu kan du lyfta ut en del av din
programkod i en modell, som du kan uppdatera och ändra medan mjukvaran körs.
Ett sorts "okompilerad kod" som gör din mjukvara otroligt mycket mer
anpassningsbar och öppen för förändring än om allt kodas direkt i Java,
eller vilket språk som nu används. Naturligtvis kan ontologier även användas

som abstrakta "modeller av världen", men för företagen i industrin är det
nog inte det som är det viktiga och som borde lyftas fram!

Mvh
Eva Blomqvist

On 7/10/10 06:03 , Stig Berild wrote:

Enligt min uppfattning ligger inte OWL/RDF i fas med tiden. När det gäller
modellering räcker UML alldeles utmärkt i de allra flesta "vardagliga fall",
alltså vid behovet av modeller "på riktigt". Därmed inte sagt att det är
modellerarens dröm. Vill man koppla bort UMLs mer objektorienterade
faciliteter, dvs fokusera mer på data än på process/funktion finns MOF,
Stanli och diverse ER-modelleringsspråk tillgängliga att använda. De har
under cirka 30-talet år genererat en bred skara användare för en stor
uppsättning tillämpningsområden. Folk är helt enkelt nöjda. Ska OWL slå (RDF
är för simpelt för att utgöra en konkurrent,det erbjuder ingenting mer än
existerande språk) måste det inte bara erbjuda unika semantikrelaterade
uttrycksmöjligheter, dessa faciliteter måste dessutom vara brett
efterfrågade. Jag är ingen UML-fantast men har genom åren accepterat
verkligheten, dvs att den "vardagliga världen" inte tjusas av nya språk
eller faciliteter bara för att de är nya och kanske i något avseende
"bättre". Verkligheten är mycket krasst behovsorienterad, tar hänsyn till
existensen av tillgängliga verktyg - bred kompetens - tillgänglig service
samt kräver integrerbarhet med övriga komponenter i en övergripande

informationsarkitektur. Modellering måste kunna sättas "i produktion". Bland
annat. Och tur är väl det förresten.

En annan anledning till att kursen inte genererade så stort intresse kan

vara den illa formulerade inledningstexten. Att tala om behovet av att

strukturera 15 petabyte information per dag är ju nästintill barockt i den

mån man är seriöst intresserad av att utföra denna strukturering med

semantik i tankarna. Alla som har arbetat med semantikfokuserad modellering

(dvs begreppsmodellering) i reella projekt vet att det är ett mycket
komplext och krävande arbete redan inom ett mycket begränsat
tillämpningsområde. Det är praktiskt omöjligt att göra det med 15 petabyte
som input - om det ska ske seriöst förstås. Dessutom finns ingen chans att
anpassa sig till alla de nya omständigheter, uttrycksformer,

tillämpningsfall, med mera som kontinuerligt ändrar skepnader. Googles

chefsforskare Peter Norvig noterade redan vid Semantic
Technology-konferensen 2005 att Google med sina analyserande algoritmer vid

stora datamängder är helt överlägset strukturerad information i generering

av mot informationsmassan svarande semantik. Han fick givetvis en del kritik

för påståendet. Inte konstigt eftersom han vågade säga det vid en konferens

enbart befolkad av deltagare uppfyllda av modeller och modellering. Men jag

är övertygad om att han har rätt när det gäller dessa datamängder och givet
information som inte specifikt kan preciseras till ett väldefinierat och
stabilt informationsområde. Det har ännu större sanningshalt idag nu när

bara Google analyserar nästan dubbelt så mycket information per dag (25-30
petabyte).

Därmed inte sagt att strukturerad information är "ute", tvärtom. Men det
gäller att välja ett tillämpningsområde där modellering fungerar. Dessutom
gäller det att, innan modellering startar, mycket välartikulerat och bland
deltagare få accepterat vad det specifika syfte med modelleringen är. Det är
kul att modellera, nästan beroendeframkallande, men i "verkligheten" är det

knappast ett gångbart argument. I alla fall inte om utfallet ska falla

uppdragsgivarna i smaken.

/Stig

2010/10/6 Peter Krantz<peter....@gmail.com>

2010/10/6 Lundberg<lundber...@gmail.com>:

Tyvärr ställdes kursen in. Jag var anmäld och fick denna förklaring
precis.

Ja, mycket trist. Jag är dock inte så förvånad eftersom det i

minerfarenhet är mycket få som arbetar med vokabulärer och
informationsmodeller "på riktigt". Just nu torrsimmar de flesta i UML
och har inte tänkt på hur man bygger återanvändbara modeller som

hänger ihop.

Mvh,

Peter

--
Det här meddelandet skickas till dig eftersom du prenumererar på gruppen
SSWIG i Google Groups.
Om du vill göra ett inlägg i den här gruppen skickar du e-post till
ss...@googlegroups.com.
Om du vill sluta prenumerera på den här gruppen skickar du e-post till
sswig+un...@googlegroups.com.

För fler alternativ, besök gruppen på
http://groups.google.com/group/sswig?hl=sv.

--
Det här meddelandet skickas till dig eftersom du prenumererar på gruppen
SSWIG i Google Groups.
Om du vill göra ett inlägg i den här gruppen skickar du e-post till
ss...@googlegroups.com.
Om du vill sluta prenumerera på den här gruppen skickar du e-post till
sswig+un...@googlegroups.com.

För fler alternativ, besök gruppen på
http://groups.google.com/group/sswig?hl=sv.

--

Det här meddelandet skickas till dig eftersom du prenumererar på gruppen
SSWIG i Google Groups.
Om du vill göra ett inlägg i den här gruppen skickar du e-post till
ss...@googlegroups.com.
Om du vill sluta prenumerera på den här gruppen skickar du e-post till
sswig+un...@googlegroups.com.

För fler alternativ, besök gruppen på
http://groups.google.com/group/sswig?hl=sv.

--
Det här meddelandet skickas till dig eftersom du prenumererar på gruppen SSWIG i Google Groups.
Om du vill göra ett inlägg i den här gruppen skickar du e-post till ss...@googlegroups.com.
Om du vill sluta prenumerera på den här gruppen skickar du e-post till sswig+un...@googlegroups.com.

Eva Blomqvist

unread,

Oct 8, 2010, 2:32:17 AM10/8/10

to ss...@googlegroups.com

Kul med lite diskussion... :-)

On 8/10/10 05:50 , Stig Berild wrote:

Passar på och kommenterar detta också, nu när jag ändå håller på.

Är för egen del inte alls trött på modeller som abstraktioner av världen. Vi behöver dessa modeller till allt möjligt, både för att kunna hantera information om en intressant värld (lagra, utbyta, ...) och för att bättre förstå den semantik som ligger bakom det språkbruk som tillämpas inom ett visst tillämpningsområde. Bland annat. Det finns ingen funktionalitet att abstrahera och det ska heller inte finnas. Informationen försöker ge en bild av en "verklighet". Aktuell, historisk, framtidsinriktad, ...... Här fungerar de flesta modelleringsspråk.

Visst finns det användningsområden för "abstraktioner av världen", men det är inte här jag ser att OWL/RDF har något nytt att komma med. Jag har sett alltför många forskningsprojekt som går i stå när det är dags för ontologierna (som tur är inget av de jag medverkat i, men väl deras föregångare). Vad jag menar är att det finns två sätt att se på ontologier: antingen är de (1) en sorts "sanning", en modell som ska försöka avbilda världen som exakt och korrekt som möjligt, eller så är de (2) en komponent som ska lösa ett visst problem genom att avbilda den del av världen som är relevant på ett sådant sätt att vi effektivt kan lösa en specifik uppgift. Om uppgiften råkar vara att förstå begrepp eller eller enbart kartlägga och lagra data, så kan förstås (1) och (2) sammanfalla, men det finns en mängd problem när man försöker skapa den här typen av ontlogier (scoping, konflikthantering mellan definitioner osv).

Det jag menade när jag skrev att jag är trött på "modeller som en abstraktion av världen" var att jag är trött på att man blandar ihop dessa mål, och det tror jag är vad du är inne på också Stig. Ett av de vanligaste argumentet mot att använda ontologier brukar vara att man kommer fastna i abstrakta diskussioner och sen inte få ut någon verklig nytta av dem ändå. Därför behöver vi fokusera på (2) om vi nu ska få företag och folk i branschen i allmänhet att nappa på det här med semantic web och ontologier. Vi behöver visa att ontologier kan skapas genom att man sätter upp ett antal väldefinierade krav (jfr. mjukvara), modellerar dessa, omsorgsfullt testar sina moduler och den integrerade ontologin så att den uppfyller kraven, och levererar den i tid. Det finns en mängd forskare inom området som nu skulle rysa och säga att detta är en hädelse, man måste först diskutera de ontologiska distinktioner man vill föra fram och de grundläggande skillnaderna mellan endurants och perdurants, och olika modeller för tid, och och... och sen kommer de sitta där och diskutera vilken modell av tid som är den bästa, tills vartenda företag har sprungit ut genom andra dörren... ;-)

Sedan finns det behov av att skapa nya dynamiska verkligheter, att försöka efterlikna dynamiken i existerande verkligheter för att den vägen kunna generera fram intressant information, öka förståelse och så vidare. I det senare fallet brukar man tala om simuleringar. Det sker genom programkod och allra helst med hjälp av ett programmeringsspråk som erbjuder önskad uttryckskraft och faciliteter som i möjligaste mån kan skapa de typer av företeelser man vill se i denna dynamiska värld. De objektorienterade språken har tillkommit för detta ändamål. Vilket som är bäst är en smaksak. Själv programmerade jag en hel del i Simula på 70-talet innan det språket slutade stödjas (ingen fortsatt kompilatorutveckling t.ex.). Synd eftersom det var det första riktiga objektorienterade språket. Dessutom alldeles utmärkt för sitt ändamål. Klockrent!

Det är alltså viktigt att skilja på dessa olika förutsättningar, representationen av ett tillstånd för en existerande verklighet och formulering av dynamiska digitala verkligheter (nya eller avbildande). Det kan vara allt ifrån de spelvärldar som Playstation 3 erbjuder till mer konventionella tillämpningar som grafiska gränssnitt, Protegé, webbgränssnitt och allt annat. De behöver olika språk för att kunna uttryckas.

Det är för övrigt något många har missat när de använder UML, som ju kan beskriva såväl information som beteende/dynamik. Man modellerar ofta tillståndsmodeller men lägger ändå in beteende i de objekt som modelleras. Eftersom objekten i sig inte har något beteende anger man istället beteende för den funktionalitet som opererar på modellerna, dvs funktionalitet i det verktyg som tillämpas för hantering av modellerna (exv store, delete, check, ...). Ute och cyklar är man då.

Så är denna värld. Kanske inte dumt med en portion forskning som reder ut "begreppen", ser till att diverse flum förpassas till cylinderarkivet samt lägger en hållfast agenda mot framtiden.

Vi har chansen i Sverige eftersom vi har en ovanligt lång modelleringshistoria att falla tillbaka på.

Håller helt med. Vi som forskare har ett stort ansvar att "reda ut begreppen", snarare än att förvirra dem. En del forskare älskar att försöka beskriva sin forskning så avancerat som möjligt, men det är ingen utmaning att prata så folk INTE förstår! Utmaningen ligger i att beskriva det vi håller på med så enkelt och klart som möjligt, så att personer och företag som inte forskar inom området förstår vad som är poängen och hur de kan dra nytta av det. Jag är ju bara en novis i branschen, och vet att jag har mycket att jobba på på den fronten, men det är självklart målet.

Hälsn Eva

Stig Berild

unread,

Oct 8, 2010, 4:49:25 PM10/8/10

to ss...@googlegroups.com

Tack Eva, jag njuter av en del av dina synpunkter!

2010/10/8 Eva Blomqvist <evab...@gmail.com>

Kul med lite diskussion... :-)

Visst finns det användningsområden för "abstraktioner av världen", men det är inte här jag ser att OWL/RDF har något nytt att komma med.

Håller helt med, vi har tillräckligt med språk att välja mellan för det behovet.

Jag har sett alltför många forskningsprojekt som går i stå när det är dags för ontologierna (som tur är inget av de jag medverkat i, men väl deras föregångare). Vad jag menar är att det finns två sätt att se på ontologier: antingen är de (1) en sorts "sanning", en modell som ska försöka avbilda världen som exakt och korrekt som möjligt, eller så är de (2) en komponent som ska lösa ett visst problem genom att avbilda den del av världen som är relevant på ett sådant sätt att vi effektivt kan lösa en specifik uppgift. Om uppgiften råkar vara att förstå begrepp eller eller enbart kartlägga och lagra data, så kan förstås (1) och (2) sammanfalla, men det finns en mängd problem när man försöker skapa den här typen av ontlogier (scoping, konflikthantering mellan definitioner osv).

Det jag menade när jag skrev att jag är trött på "modeller som en abstraktion av världen" var att jag är trött på att man blandar ihop dessa mål, och det tror jag är vad du är inne på också Stig.

Jajamen!

Ett av de vanligaste argumentet mot att använda ontologier brukar vara att man kommer fastna i abstrakta diskussioner och sen inte få ut någon verklig nytta av dem ändå.

Många projekt arbetar gärna med modellering och tar fram - ofta ganska avancerade - modeller. Det är kul att modellera. Som att gå på upptäcksfärd, inte minst vid begreppsmodellering. Genererar aha-upplevelser kring begrepp som schablonmässigt och till vardags används i den egna verksamheten (om det nu är något kring den som modelleras, vilket det ofta är). Begreppen och dess innebörd konkretiseras, man kan klart konstatera att andra inte tycker samma sak, man kanske behöver formulera nya begrepp, kanske ändra termer på begrepp för att göra dem tydligare, med mycket mera. Lätt att det blir vanebildande och så spännande att det är svårt att sluta. Det går ju alltid att finslipa begreppen lite ytterligare, öka på detaljeringsgraden med nya begrepp, kanske utvidga det aktuella modelleringsområdet lite mer "när man ändå är igång", osv. Om inte annat visar allt detta att man inte inledningsvis klart formulerat syftet med modelleringen och dess utfall, sannolikt inte heller klart avgränsat den verklighet som modelleras, än mindre klargjort vilken infallsvinkel på denna verklighet som ska tillämpas. Klart som korvspad att resultatet så småningom hamnar i cylinderarkivet och därmed att en massa pengar kastats i sjön. Tyvärr brukar det sällan bli utvärderingar av dessa misslyckanden. Modelleringsteamet lyckas säkert skriva en slutrapport med massa fina grafer och kompletterande förklaringar. Hos beställaren, som ofta inte har modelleringskompetens och heller inte har möjlighet att se igenom alla aspekter på ett avancerat projekt, ser det avancerat och fint ut varför projektet säkert får fortsatt "go". Har sett detta ett antal gånger, inte minst i anslutning till stora, statligt finansierade projekt. Allt detta irriterar mig enormt.

Därför behöver vi fokusera på (2) om vi nu ska få företag och folk i branschen i allmänhet att nappa på det här med semantic web och ontologier. Vi behöver visa att ontologier kan skapas genom att man sätter upp ett antal väldefinierade krav (jfr. mjukvara), modellerar dessa, omsorgsfullt testar sina moduler och den integrerade ontologin så att den uppfyller kraven, och levererar den i tid. Det finns en mängd forskare inom området som nu skulle rysa och säga att detta är en hädelse, man måste först diskutera de ontologiska distinktioner man vill föra fram och de grundläggande skillnaderna mellan endurants och perdurants, och olika modeller för tid, och och... och sen kommer de sitta där och diskutera vilken modell av tid som är den bästa, tills vartenda företag har sprungit ut genom andra dörren... ;-)

Håller helt med. Vi som forskare har ett stort ansvar att "reda ut begreppen", snarare än att förvirra dem. En del forskare älskar att försöka beskriva sin forskning så avancerat som möjligt, men det är ingen utmaning att prata så folk INTE förstår! Utmaningen ligger i att beskriva det vi håller på med så enkelt och klart som möjligt, så att personer och företag som inte forskar inom området förstår vad som är poängen och hur de kan dra nytta av det. Jag är ju bara en novis i branschen, och vet att jag har mycket att jobba på på den fronten, men det är självklart målet.

Just precis. Att jag i tidigare mail låtit lite gnällig beror på att jag ibland upplevt att företrädare för SW just visat dessa attityder. Helt utan anledning. Jag har deltagit på flera internationella SW-konferenser där det funnits papper/presentationer som inledningsvis fått mig att undra om jag är helt knäpp eller för gammal för att förstå de presenterade finesserna - tills det kommer ett exempel som ska bevisa dessa finesser (ibland under frågestund efteråt), exempel som ofta är generande triviala och knappast kunskapshöjande. Självtilliten återställd, tack och lov. För stunden i alla fall.

Detta är i sanningens namn ingenting nytt. Jag följde på 1970-talet med förundran den diskussion som då pågick i anslutning till relationsmodellens tidiga levnad. 3:e Normalformen etablerades snabbt som en princip att följa vid modellering av tabellstrukturer. Vilket förstås inte hindrade forskare i olika läger att hitta på de mest fantastiska nya artificiella normalformer som tänkas kan. Tänkas förresten, någon tanke på om de representerade någonting praktiskt användbart eller täppte till något upplevt reellt semantiskt "hål" i den 3:e normalformen kunde inte den mest skicklige detektiv finna. (Däremot vissa brister i relationsmodellen i sig.) Samma historia kan berättas om alla varianter Entity-Relationshipmodeller som såg dagens ljus i slutet av 1970-talet.

Ingen missunnar en person att vara uppfylld av sitt ämnesområde men en viss distans kan ju aldrig skada. Att medvetet lägga ut "dimridåer" är bara dum snobbism. Och ett säkert sätt att få näringslivsföreträdare att rygga tillbaka.

En annan närliggande sak; När det gäller till exempel RDF/OWL har dessa språk ofta diskuterats som banbrytande nya, trots att visade exempel i många fall kunde vara hämtade från läroböcker från 70-talet. Det finns en historielöshet i kombination med ointresse för bakåtperspektiven som irriterar. Vid seriös forskning sitter detta intresse och respekt för existerande kunskap "i ryggmärgen". Forskningsetik.

(Nu blev det visst lite gnälligt igen.)

Hälsn
Stig

Hälsn Eva

Leif Johansson

unread,

Oct 9, 2010, 4:49:38 PM10/9/10

to ss...@googlegroups.com

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

> N�gra intressanta forskningsprojekt att kolla n�rmare p�? Vad h�ller
> f�retagen p� med? Publiceras n�gon svensk linked data? N�gra h�ftiga
> applikationer att ta upp som goda exempel p� "svensk semantic web"?

F�r n�gra �r sedan gjorde jag och Roland Hedberg en "semantisk message-
bus": OM2 (http://www.openmetadir.org/) - det handlar om provisionering
av identitetsinformation, dvs ett slags SPML-on-steroids :-)

Projektet har v�l inte f�tt enormt genomslag vilket helt klart h�nger
ihop med att OWL inte �r vardagsmat.

N�gra slutsatser jag sj�lv dragit av erfarenheterna fr�n OM2:

- - Multipelt arv upplevs som oerh�rt knepigt av m�nga.

- - Det finns en trend att anv�nda mer "duck-typing" istf "hard typing"
i moderna programmeringsspr�k vilket delvis g�r p� tv�rs mot OWL.

- - Kodgenerering (som blir en konsekvens av att man anv�nder OWL)
introducerar ytterligare en dimension av komplexitet i projekt som
(likt multipelt arv) �r mycket sv�rt f�r de flesta att hantera.

MVH leifj

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.10 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iEYEARECAAYFAkyw1WIACgkQ8Jx8FtbMZnfLGQCghRzUsHYZSbXQ1WZbwN6fX941
EVYAoJjnGDvI+rWysX0lf2vXOGOcEbWu
=uGMO
-----END PGP SIGNATURE-----

Stig Berild

unread,

Oct 9, 2010, 7:33:39 PM10/9/10

to ss...@googlegroups.com

Multipla arv är svårt. Kräver eftertanke. Lätt att hamna fel. Jag har genom åren sett alltför mycket felanvändning även av enkla arv. Man lockas till exempel ange ISA-samband när det i själva verket är fråga om 1:M-relateringar. Exempelvis Anställd ISA Person. En anställd är ju rent fysiskt en person kan man tycka. Men Anställd är en roll (vilket egentligen även Person är om man vill hårddra) och personen ifråga kan vara anställd på många ställen. 1:M alltså. Spelar väl ingen roll brukar motargumentet vara, huvudsaken att det går att entydigt härleda personen ifråga om man har träff på viss anställd. Men det är ju just vad alla 1:M-relateringar erbjuder i den mån man befinner sig i "M-delen". Har ingen med arv att göra, men väl refererbarhet. Arv kräver 1:1 så att exempelvis polymorfism fungerar.

Multipelt arv kan förresten vara lite luddigt utifrån ett semantiskt perspektiv. Ta Blindtarmsinflammation. Borde ju kunna ärva både från Blindtarm och från Inflammation. Men Blindtarmsinflammation är ju rent semantiskt i huvudsak en inflammation snarare än en kroppsdel. Alltså borde arvet gälla Inflammation enbart. Arv från Blindtarm borde i konsekvensens namn gälla något annat exempelvis "Inflammerad blindtarm". Med uppdelningen går det att på subnivån med större precision placera egenskaper där de hör hemma. Men säkert finns det argumentation för att förfäkta motsatsen, exempelvis att det är två olika termer på samma sak. Men är det det fullt ut?

Jag har i jobbet haft anledning att sätta mig in i ett mycket stort begreppssystem inom vården som heter Snomed CT. Finns mycket att säga om det systemet. Har ingen susning om de begrepp som används inom vård och omsorg, de som omfattas av Snomed CT är säkert bra. Men "modelleringsspråket" lämnar en hel del övrigt att önska, framförallt tillämpningen av det. Det mesta som uttrycks är ISA-relateringar, men slarvigt - tycker jag. Skrev därför en rapport som tar upp diverse olika aspekter på ISA-relateringar. Rapporten var tänkt som ett diskussionsunderlag. Någon diskussion blev det dock aldrig ....... trots att företrädarna för Snomed CT fanns med i projektet.

Om någon är intresserad finns rapporten finns på webbplatsen www.informationsarkitektur.se. Där finns en också en hel del andra rapporter. "ISA-relateringar" finns som första rapport på I-avdelningen.

Skrev en rapport 1991 som introducerade objektorientering. Det finns en passus där om multipla arv. Den ligger under www.sisuportal.se. Direktlänk till rapporten:

http://sisudocs.cnet.se/SISU%20Rapport/1991/SR-nr13%20-%20Objektorientering%20-%20de%20vanligaste%20begreppen-ocr.pdf

Obs, rapporten är inskannad (skrevs på sin tid - dumt nog i ordbehandlingsprogrammet More) och därför rejält stor 29 Mb.

Allt för nu
Stig

2010/10/9 Leif Johansson <le...@mnt.se>

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

> Några intressanta forskningsprojekt att kolla närmare på? Vad håller
> företagen på med? Publiceras någon svensk linked data? Några häftiga
> applikationer att ta upp som goda exempel på "svensk semantic web"?

För några år sedan gjorde jag och Roland Hedberg en "semantisk message-

bus": OM2 (http://www.openmetadir.org/) - det handlar om provisionering
av identitetsinformation, dvs ett slags SPML-on-steroids :-)

Projektet har väl inte fått enormt genomslag vilket helt klart hänger
ihop med att OWL inte är vardagsmat.

Några slutsatser jag själv dragit av erfarenheterna från OM2:

- - Multipelt arv upplevs som oerhört knepigt av många.

- - Det finns en trend att använda mer "duck-typing" istf "hard typing"
i moderna programmeringsspråk vilket delvis går på tvärs mot OWL.

- - Kodgenerering (som blir en konsekvens av att man använder OWL)

introducerar ytterligare en dimension av komplexitet i projekt som

(likt multipelt arv) är mycket svårt för de flesta att hantera.

MVH leifj

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.10 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iEYEARECAAYFAkyw1WIACgkQ8Jx8FtbMZnfLGQCghRzUsHYZSbXQ1WZbwN6fX941
EVYAoJjnGDvI+rWysX0lf2vXOGOcEbWu
=uGMO
-----END PGP SIGNATURE-----

--
Det här meddelandet skickas till dig eftersom du prenumererar på gruppen SSWIG i Google Groups.
Om du vill göra ett inlägg i den här gruppen skickar du e-post till ss...@googlegroups.com.
Om du vill sluta prenumerera på den här gruppen skickar du e-post till sswig+un...@googlegroups.com.

Peter Krantz

unread,

Oct 10, 2010, 3:43:49 AM10/10/10

to ss...@googlegroups.com

Kommer in i diskussionen lite sent här, men kastar mig in med gott mod :-)

2010/10/7 Stig Berild <stig....@gmail.com>:

> Enligt min uppfattning ligger inte OWL/RDF i fas med tiden. När det gäller
> modellering räcker UML alldeles utmärkt i de allra flesta "vardagliga fall",
> alltså vid behovet av modeller "på riktigt".

Det beror på vad modellerna skall användas till. Att UML fungerar för
att producera designdokument för systemutvecklare i ett
systemutvecklingsprojekt har jag inga problem med (det är ju det UML i
första hand är till för). I vissa fall kan man även bruka dem för
dialog med folk i verksamheten.

Men vill man ha t.ex. klassdiagram i UML som bas för en gradvis
framväxande semantisk interoperabilitet mellan organisationer blir det
svårare eftersom det inte finns något definierat sätt att entydigt
referera till delar av en modell (t.ex. en viss klass).
Sammankopplingar med andra modeller blir krångliga att hantera och
upptäckbarheten via t.ex. ett maskinellt stöd är heller inte lätt.

På samma sätt som när t.ex. man tar fram platta termlistor blir det
ofta produkter som inte är sammankopplade med de gränssnitt, scheman
mm som realiserar t.ex. ett informationsutbyte. Det hänger m.a.o inte
ihop och i min erfarenhet uppstår det direkt problem när ett statiskt
UML-dokument stoppas in i en pärm i förhoppningen om att alla berörda
i framtiden kommer att gå och titta i den för att få reda på hur en
domän är modellerad.

Jag anser att den stora styrkan med OWL/RDFS är dess webborienterade
publiceringssätt och möjligheter till entydig elektronisk
refererbarhet.

Med dessa kan du entydigt referera till begrepp från ett XML-schema
eller en WSDL-artefakt i något SOA scenario [1] och få
implementationer att på ett tydligare sätt hänga ihop med
informationsmodellen. Från en och samma modell uttryckt i OWL/RDFS kan
man ju även generera flera olika vyer beroende på vem som skall ta del
av den (termlistor för t.ex. utbildare, klassdiagram i UML för
utvecklare etc).

Det möjliggör i sin tur ett enklare sätt att ta ett
livscykelperspektiv på modeller (som i min erfarenhet idag oftast är
spridda snapshots av insatser av en liten "informationselit" i
organisationer).

[1]: http://www.w3.org/TR/2007/REC-sawsdl-20070828/

> Folk är helt enkelt nöjda. Ska OWL slå (RDF
> är för simpelt för att utgöra en konkurrent,det erbjuder ingenting mer än
> existerande språk) måste det inte bara erbjuda unika semantikrelaterade
> uttrycksmöjligheter, dessa faciliteter måste dessutom vara brett
> efterfrågade.

Som tidigare tror jag inte OWL - språket - i sig erbjuder något
särskilt lockande. De semantiska uttrycksbehoven för de flesta är
säkert täckta i flera av de andra språken. Men möjligheterna att kunna
hantera och integrera själva modellartefakten har stora fördelar mot
flera av de andra.

>
> Dessutom
> gäller det att, innan modellering startar, mycket välartikulerat och bland
> deltagare få accepterat vad det specifika syfte med modelleringen är.

Precis! Många arbetar med diffusa mål här och har oftast inte uttryckt
vilka effekter med modelleringen man vill skall uppstå. Skulle fler
göra det är jag övertygad om att man skulle börja hitta krav på andra
sätt att hantera resultatet av modellering som i sin tur ställer krav
på verktyg mm.

På minussidan för egentligen hela semweb-spåret finns communityn.
Communityn runt ett teknikområde bidrar starkt till hur lätt det är
att sätta sig in i dess olika möjligheter och möjliga användningar i
sin egna verkamhet. Nu kanske jag blir sågad av andra här på listan,
men semwebcommunityn är tungt belastad av forskarvärlden. På W3C:s
semweblista känns det som att varannat mail handlar om "research
positions", "Last call for papers" eller forskarkonferenser. Merparten
av de som är aktiva i standardiseringsarbetet är äldre farbröder med
skägg.

Området skulle behöva bryta sig ut från detta och hamna på en nivå som
är mer verklighetsnära för att andra skall våga närma sig det tror
jag.

Mvh,

Peter

Emil Eifrem

unread,

Oct 10, 2010, 6:56:04 AM10/10/10

to ss...@googlegroups.com

2010/10/10 Peter Krantz <peter....@gmail.com>:

> På minussidan för egentligen hela semweb-spåret finns communityn.

[snip]

> semwebcommunityn är tungt belastad av forskarvärlden. På W3C:s
> semweblista känns det som att varannat mail handlar om "research
> positions", "Last call for papers" eller forskarkonferenser.

+1

En intressant (men rätt förödande) konsekvens av forskartätheten är
att merparten av den mjukvara som produceras i semweb-communityn
skrivs av människor vars primära leverabel är ett akademiskt papper.
Själva mjuvkaran är en sidoeffekt eller transportsträcka. Vilket leder
till rätt dåliga produkter. Jag tror det är därför så lite mjukvara
från semweb-världen används i större skala.

--
Emil Eifrém, CEO [em...@neotechnology.com]
Neo Technology, www.neotechnology.com
Cell: +46 733 462 271 | US: 206 403 8808
http://blogs.neotechnology.com/emil
http://twitter.com/emileifrem

Peter Krantz

unread,

Oct 10, 2010, 7:53:36 AM10/10/10

to ss...@googlegroups.com

2010/10/10 Emil Eifrem <em...@neotechnology.com>:

>
> Själva mjuvkaran är en sidoeffekt eller transportsträcka. Vilket leder
> till rätt dåliga produkter.

Precis! Ofta är användbarheten åsidosatt eftersom produkten i huvudsak
tagits fram för att illustrera ett case. Det brukar också vara
produkter som inte arbetas vidare på i någon större skala efter det
att de lanserats.

Mvh,

Peter

Stig Berild

unread,

Oct 10, 2010, 2:48:52 PM10/10/10

to ss...@googlegroups.com

Tänkte bara på ytterligare en sak att analysera och ta ställning till när det gäller arv. Något jag var otydlig med i exemplet i förra mailet. "Inflammerad blindtarm" är en specialisering av Blindtarm bara om innebörden av "Inflammerad blindtarm" är en mer detaljerad aspekt, en precisering av Blindtarm. Då föreligger 1:1-samband. Är däremot innebörden att "Inflammerad blindtarm" står för var och en av de inflammationer den aktuella blindtarmen varit utsatt för är det ett 1:M-samband och alltså inte en ISA-relatering. I båda fallen gäller att verkligheten är personers blintarmar. Ytterligare en möjlighet, som jag exempelvis tolkat är syftet med begreppen i Snomed CT, är att Blindtarm och "Inflammerad blindtarm" var och en står för ett generiskt begrepp, dvs som generiska företeelser frikopplade från någon persons specifika blindtarm. Begreppen är inga abstraktioner av någon specifik verklighet utan två specifika kunskapsentiteter. De är förekomster i en verklighet bestående av en uppsättning begrepp. (En vokabulär helt enkelt, givet att man vill ge termen vokabulär den innebörden.) Modellens objekttyp, abstraktionen, heter förmodligen "Begrepp". ISA-samband är inte sättet att relatera dem, snarare "förtydligar", "utgår ifrån" eller liknande.

Det finns många "fällor" att hamna i ..........

/Stig

2010/10/10 Stig Berild <stig....@gmail.com>

Stig Berild

unread,

Oct 10, 2010, 11:03:24 PM10/10/10

to ss...@googlegroups.com

2010/10/10 Peter Krantz <peter....@gmail.com>

Kommer in i diskussionen lite sent här, men kastar mig in med gott mod :-)

Men vill man ha t.ex. klassdiagram i UML som bas för en gradvis
framväxande semantisk interoperabilitet mellan organisationer blir det
svårare eftersom det inte finns något definierat sätt att entydigt
referera till delar av en modell (t.ex. en viss klass).

Helt rätt Det är ett problem som de som arbetar med referensmodellen för SOA inte har tagit tag i, alternativt inte förstått behovet av.

På samma sätt som när t.ex. man tar fram platta termlistor blir det
ofta produkter som inte är sammankopplade med de gränssnitt, scheman
mm som realiserar t.ex. ett informationsutbyte. Det hänger m.a.o inte
ihop och i min erfarenhet uppstår det direkt problem när ett statiskt
UML-dokument stoppas in i en pärm i förhoppningen om att alla berörda
i framtiden kommer att gå och titta i den för att få reda på hur en
domän är modellerad.

Detta är ett bekymmer i nästan alla projekt. Man är lycklig över att ha kommit fram till en modell som ser snygg ut. Sedan blundar modellerarna i förhoppningen om att "någon" ska ta hand om detta tjusiga alster för dess vidare färd genom projektet. Det fungerar inte. Redan från början måste det klart framgå vad modellen ska användas till, antingen under projektets fortsatta levnad eller, helst, i den produktionsmiljö som förhoppningsvis blir projektets resultat.

Jag anser att den stora styrkan med OWL/RDFS är dess webborienterade
publiceringssätt och möjligheter till entydig elektronisk
refererbarhet.

Med dessa kan du entydigt referera till begrepp från ett XML-schema
eller en WSDL-artefakt i något SOA scenario [1] och få
implementationer att på ett tydligare sätt hänga ihop med
informationsmodellen. Från en och samma modell uttryckt i OWL/RDFS kan
man ju även generera flera olika vyer beroende på vem som skall ta del
av den (termlistor för t.ex. utbildare, klassdiagram i UML för
utvecklare etc).

Helt okej argumentation, men det finns olika ansatser för detta, ansatser som inte nödvändigtvis innefattar OWL/RDFS.

På minussidan för egentligen hela semweb-spåret finns communityn.
Communityn runt ett teknikområde bidrar starkt till hur lätt det är
att sätta sig in i dess olika möjligheter och möjliga användningar i
sin egna verkamhet. Nu kanske jag blir sågad av andra här på listan,
men semwebcommunityn är tungt belastad av forskarvärlden. På W3C:s
semweblista känns det som att varannat mail handlar om "research
positions", "Last call for papers" eller forskarkonferenser. Merparten
av de som är aktiva i standardiseringsarbetet är äldre farbröder med
skägg.

Området skulle behöva bryta sig ut från detta och hamna på en nivå som
är mer verklighetsnära för att andra skall våga närma sig det tror
jag.

Du blir inte alls sågad. Det är mitt i prick. Det bara stärker det som jag i tidigare mail försökt uttrycka. Det finns för mycket snobbism, verklighetsfrånvändhet, dimmigheter och historielöshet i SW-communityn. Inte undra på att att det inte "tar fart". Lite av att fokusera på träden, ja ofta bara buskarna, istället för skogen - dvs. syfte, helhet och känsla för aktuella strömningar.

Säger en person som både är gubbe och har skägg .....

/Stig

330.gif

Leif Johansson

unread,

Oct 11, 2010, 4:02:38 AM10/11/10

to ss...@googlegroups.com

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

On 10/10/2010 12:56 PM, Emil Eifrem wrote:
> 2010/10/10 Peter Krantz <peter....@gmail.com>:
>> P� minussidan f�r egentligen hela semweb-sp�ret finns communityn.
> [snip]
>> semwebcommunityn �r tungt belastad av forskarv�rlden. P� W3C:s
>> semweblista k�nns det som att varannat mail handlar om "research

>> positions", "Last call for papers" eller forskarkonferenser.
>
> +1
>

> En intressant (men r�tt f�r�dande) konsekvens av forskart�theten �r

> att merparten av den mjukvara som produceras i semweb-communityn

> skrivs av m�nniskor vars prim�ra leverabel �r ett akademiskt papper.
> Sj�lva mjuvkaran �r en sidoeffekt eller transportstr�cka. Vilket leder
> till r�tt d�liga produkter. Jag tror det �r d�rf�r s� lite mjukvara
> fr�n semweb-v�rlden anv�nds i st�rre skala.
>

++1 spot on

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.10 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iEYEARECAAYFAkyyxJ0ACgkQ8Jx8FtbMZneFagCggyBFGDFTAEqtlj/Ns/RPFRIL
tXcAnRnl4i20I6Ef5jW151+ZMIBrj4r9
=gpxe
-----END PGP SIGNATURE-----

Peter Krantz

unread,

Oct 11, 2010, 4:13:04 AM10/11/10

to ss...@googlegroups.com

2010/10/11 Stig Berild <stig....@gmail.com>

>
> Helt okej argumentation, men det finns olika ansatser för detta, ansatser som inte nödvändigtvis innefattar OWL/RDFS.
>

Intressant. Har du några exempel?

>
> Det bara stärker det som jag i tidigare mail försökt uttrycka. Det finns för mycket snobbism,
> verklighetsfrånvändhet, dimmigheter och historielöshet i SW-communityn.

På liknande sätt är det ju även inom andra områden. Den som försöker
hitta information om t.ex. hur man begreppsmodellerar i Stanli tror
direkt att det bara är applicerbart för geodata.

Vidare finns det ett grundläggande problem med standarder där man inte
kan läsa dokumentationen utan att behöva betala stålar till t.ex. SIS
eller ISO. Att förhindra spridning genom betalväggar är ett
fundamentalt feltänk i de fall man önskar en så stor spridning som
möjligt.