Ciao a tutti e in particolare ai programmatori di TwitAntonio.
Dopo un bel po' di tempo, ho finito (almeno allo stato di super-bozza) quello che avevo iniziato all'hackaton:
http://artemisia.leafbioscience.com:8080/open-politici-topics/ws/open-pol-topics/get-by-topics/xml?q=lavoro
http://artemisia.leafbioscience.com:8080/open-politici-topics/ws/open-pol-topics/get-by-topics/json?q=ricerca%20sviluppo%20formazione
http://artemisia.leafbioscience.com:8080/open-politici-topics/ws/open-pol-topics/get-by-topics/json?q=sport,%20cultura
ovvero: gli mandi una stringa di keyword separate da virgola o spazio e
ti dice gli account dei politici che hanno fatto dichiarazioni su quegli
argomenti. La cosa è basata su uno scraper che si piglia i dati da
open-politici.it
(
http://politici.openpolis.it/dichiarazioni-dei-politici-per-argomento).
Il codice è qui:
http://github.com/marco-brandizi/open-politici-topics
Non so bene quanto possa piacere la cosa allo stato attuale, visto che
ha un po' di limiti, il principale dei quali è che non sempre gli
argomenti sono significativi. Però si potrebbe estendere, soprattutto
quando open-polis metterà a disposizione delle API, con cui andare a
vedere anche altre cose (per esempio le commissioni parlamentari o gli
assessorati). A questo scopo, ho già contattato open-polis e mi hanno
detto che stanno sviluppando delle API, ma non saranno disponibili prima
delle elezioni (giustamente hanno altre priorità).
Se si vuole usare questo (e anche una versione futura), si tratta di
aggiungere un campo di testo a TwitAntonio (cerca per argomento)
invocare il REST service di cui sopra, vedere se gli account ritornati
esistono nel DB di TwitAntonio (se mi mettete a disposizione una API per
quest'ultima funzione posso applicare questo filtro direttamente
durante lo scraping, per cui non servirebbe più durante la ricerca) e
infine presentare i risultati.
Il server di cui sopra è mio, ma sono piuttosto sicuro che non può
reggere un traffico superiore a 'sito amatoriale con quattro gatti che
lo usano'. Se si decide di usare la cosa in produzione, sarebbe molto
meglio cambiare server.
Fatemi sapere che ne pensate, comunque ho buttato giù il codice per
curiosità e lo metto a disposizione a prescindere. A proposito di
quest'ultimo, come potete vedere è scritto e documentato con un minimo,
ma proprio minimo di decenza, ma se per caso vi aspettate un capolavoro
di ingegneria del software, potrete trovare cose decisamente migliori
negli altri repository del mio account GitHub...
Ciao