--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "jug-genova" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a jug-genova+...@googlegroups.com.
Per postare in questo gruppo, invia un'email a jug-g...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/jug-genova.
Per altre opzioni visita https://groups.google.com/d/optout.
--
mi sembra comunque una cosa non facile da "automatizzare" perché più legata alla fonte (umana) del dato che vai a leggere dal file CSV, più che alla tecnologia che puoi usare per tradurlo
ti servirebbero dei metadati descrittivi del formato, tipo le varie proposte di standard per i metadati degli open-data: ad es. ho trovato questi, che non conoscevo
--
Potresti comunque fare una serie di parse (int, double, Date in vari formati) per decidere empiricamente un tipo di dato ma lasciare sempre la possibilità di scelta all'utente?
Se non ho capito l'obbiettivo da raggiungere è preso in input un file CSV ne leggo qualche riga a campione per capire la tipologia del dato per così da fornire all'utente una maschera del tipoCampo 01 : StringaCampo 02 : DataCampo 03 : interoCampo 04 : intero decimaledove l'utente può interagire per apportare eventuali modifiche se l'algoritmo ha sbagliato qualcosa, dopodichè dare il via all'import effettivo del file.
Forse banalizzo, ma non potresti mettere insieme una serie di regular expression per capire di quale tipologia di dato si tratta?
--
--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "jug-genova" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a jug-genova+...@googlegroups.com.
Per postare in questo gruppo, invia un'email a jug-g...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/jug-genova.
Per altre opzioni visita https://groups.google.com/d/optout.
Non sono d'accordo, io preferirei la soluzione con i parser, per il seguente motivo: comunque per essere inseriti nel DB con il tipo corretto i dati andranno parserizzati; a questo punto tanto vale usare il parser anche come validatore del formato del dato. Altrimenti si rischiano situazioni in cui la regexp dice "pippo" ma parsePippo fallisce. L'unico motivo che vedrei eventualmente per preferire le regexp sono considerazioni di performance, ma naturalmente senza fare misurazioni non si può dire niente.