Ciao Pablo,
On Fri, 4 May 2018 at 12:54, pablopers pablope...@gmail.com wrote:
partendo dallo script di Andrea Borruso Qui, si riesce ad estrarre i dati dal Portale OpenCup in formato Csv, attraverso la partita IVA dell'Ente.il Csv è "ricco" di colonne e per l'uso che vorrei farne (dataset sul portale Open data) avrei, quindi la necessità di:1) eliminare dal file una serie di colonne (es. "CODICE_STATO", "STATO" etc)2) ordinarli in ordine crescente per "ANNO_DECISIONE" (ordine crescente) e "STATO_PROGETTO" (attivo)
tra i modi per farlo c’è quello di fare una query SQL sul file CSV di output, tramite csvsql
di csvkit:
csvsql --query 'select "CUP","ANNO_DECISIONE","STATO_PROGETTO" from "80016350821" order by "ANNO_DECISIONE","STATO_PROGETTO"' 80016350821.csv >./output.csv
Nell’esempio di sopra scelgo le colonne che voglio in output, e poi ordino per “ANNO_DECISIONE” e “STATO_PROGETTO”‘
CUP,ANNO_DECISIONE,STATO_PROGETTO
D77H83000000004,1983,ATTIVO
D77B86000000004,1986,ATTIVO
D93J87000000001,1987,ATTIVO
D74D88000000001,1988,ATTIVO
D72C90000000001,1990,ATTIVO
3) realizzare del file anche la versione Json.
Sempre in csvkit c’è csvjson:
<output.csv csvjson | jq . >./output.json
Facci sapere