Ciao ragazzi/e,
allora, riemergo dal trasloco e mi metto un po' in pari in viaggio per Bologna, e vi faccio una segnalazione spero utile, per le giornate a seguire, specie per la giornata di sabato.
[hat SpazioDati on]
Vi aggiorno in maniera informale e veloce su alcune cose a cui stiamo lavorando come SpazioDati, oltre a quelle già raccontate attraverso il blog:
- il progetto linkedStat già accennato in lista a fine febbraio[0], utile anche per la sessione di domenica mattina sul linked data, dalla doc si possono mettere le mani in pasta al tema linked seguiti da un comodo tutorial, se si vuole portare avanti la formazione della domenica
Tra i tool abbiamo:
1. estensione per fare entity extraction con Open Refine, di cui parlerò domenica mattina velocemente, collegandomi magari alla sessione su Refine di domani pomeriggio[1]. L'estensione si trova qui
http://freeyourmetadata.org/named-entity-extraction/ e funziona sia con refine 2.5 che con 2.6.
2. anticipazione per gli amici data journalist e non solo: tra poco, pochissimo, sarà disponibile uno script per google spreadsheet che permette l'uso delle API di dataTXT-NEX direttamente dalla singola cella del foglio elettronico. Questo significa che potreste fare estrazione di entità, disambiguazione e linking verso risorse di DBpedia direttamente dalle celle di un google spreadsheet, come fosse una formula qualsiasi applicata al vostro contenuto. Chi volesse restare aggiornato su questo, si iscriva pure a
dandelion.eu che verrà avvisato live sulle novità:
https://dandelion.eu/accounts/register/?next=/Le potenzialità messe a disposizione da un tool di questo tipo per facilitare il lavoro di pulizia, e di link verso la LOD dei dati contenuti nei fogli elettronici condivisi sono davvero tantissime :) Chi mi conosce sa che credo nel valore dell'avvicinare per piccoli step alcuni pezzetti del mondo Linked Data, senza la paura di tutto lo stack tecnologico tradizionale. A volte basta poco .)
3. per chi ama Python, abbiamo fatto questo:
https://github.com/SpazioDati/python-dandelion-eu un modo veloce ed agevole per accedere alle semantic text api di dandelion.eu. Alberto, adesso potresti pure fare delle prove ora che smanetti in Python :) La doc direi che è esautistiva:
http://python-dandelion-eu.readthedocs.org/en/latest/
4. il servizio dataTXT-NEX è ora tra i servizi integrati anche a NERD, citato tra i tool anche dell'evento romano del 20-21 febbraio:
http://nerd.eurecom.fr [\hat SpazioDati off]
Visto che ci sarò fino a domenica mattina, se vorrete approfondire qualsiasi cosa, rompetemi pure le scatole nei prossimi giorni :)
matt
[0] -
https://groups.google.com/d/msg/spaghettiopendata/_j6VuSEypuI/TG8Wz7e93FMJ[1] -
http://www.spaghettiopendata.org/content/google-refine-python-e-l-anagrafe-delle-scuole-italiane#.UzQ2xcdtalk