vilniusR - tarsi aiškiai suprantama MISIJA - dalintis R patyrimu, o vat paminėtas datadive mane suintrigavo, bet dar negaliu atsakyti ar norėčiau dalyvauti, nes nesuprantu "kas tai bus" - todėl kol nepamatysiu suformuluotos MISIJOS (t.y. funkcijos, kas bus daroma) VIZIJOS (t.y. tikslų, kokis viso to prasmė) - negalėsiu nieko atsakyti
be to nelabai suprantu
/ ar čia naujas marketinginis buzzwordas (o iš esmės - keikskmažodis:-) kurio sinoniminės šaknys - elementarusis "open data"
/ ar tai "data scraping" dar kitaip vadinamas "data journalism" kuo jau keletą metų užsiima
ScraperWiki and Open Knowledge Foundation win grants to help data journalism
skirtingai nuo pvz
kurie kaip suprantu uždarė duomenis
DataDiver Technologies offers a full gambit of instant criminal searches that have been collected from jurisdictional data across the nation.
labiau pažengę iš ScraperWiki startup'o, suteikė įrankių rinkinį (software as service) kuriuo net aš supratau kaip naudotis ;) - labai patogu turėti galimybę paleisti scrap'ą online ir laikyti bei perpanaudoti duomenis sql-lite ar csv formate
tokiu būdu tarsi sklandžiai ateinu iki minties, kad norint komerciniais ar nesavanaudiško smalsumo tenkinimo tikslais su R ar su kokiu kitu įrankiu reikia truputi didesnės 'ekosferos', užtikrinančios šias funkcijas:
GAUTI (patikimą) INFO
ją galima gauti tiek scrapinant atvirus šaltinius,
tiek reikalaujant viešinti oficialius statistikos skaičius (idealiu atveju 'open data' formate, o ne xls'u failuose, kaip dabar)
tiek iš mokslininkų, atliekančių tyrimus (tiesa, tokia tyrimų db tarsi yra, tik nežinau kaip ten su atvirumu..)
LAIKYTI-SAUGOTI & PERDIRBTI (re-formatuoti)
Re-formatting data to clarify it, filter it, or make it compatible with other sets of data (for example, converting lat-long coordinates to postcodes, or feet to metres)
KOMBINUOTI, ANALIZUOTI & INTERPRETUOTI
Combining data from more than one source (for example, scraping a list of company directors and comparing that against a list of donors)
iš esmės reiktų kažkokios 'state of the art' apžvalgos LT kalba, tada galima parodyti žurnalistams, gal pasiviešins spaudoje - it tuomet galima būtų tikėtis, kad daugiau kas nors prisijungtų, supratę apie ką vyskta kalba...