You do not have permission to delete messages in this group
Copy link
Report message
Show original message
Either email addresses are anonymous for this group or you need the view member email addresses permission to view the original message
to mwetoolkit
Bonjour,
Je travaille avec Muntsa Padro à Grenoble, qui d'ailleurs vous passe le bonjour!
Nous sommes à la recherche d'un mmoyen d'extraire automatiquement les mwe selon des nouveaux corpus de domaine. C'est pour ça qu'on s'est tourné vers votre toolkit qui nous à l'air super. Simplement, j'essaie à répétition de suivre le "quick start" et impossible de lire le corpus d'exemple. Voici le code d'erreur que j'obtiens :
$ python index.py -v -i index/ted ../ted-en-sample.conll INFO: Verbose mode on ted-en-sample.conll: INFO: Found directive for filetype `CONLL` ted-en-sample.conll:14: WARNING: Empty/missing value for word attribute `syn` ted-en-sample.conll:14: .......: (Suppressing further warnings of this type) ~~> Processing entity number 30000 (99%) Building suffix array for lemma... Using C indexer to build suffix array index/ted.lemma Corpus read: 573804 words. Sorting suffix array... Sorting done! Saving... -- Error opening corpus/suffix file for reading! Building suffix array for pos... Using C indexer to build suffix array index/ted.pos Corpus read: 573804 words. Sorting suffix array... Sorting done! Saving... -- Error opening corpus/suffix file for reading! Building suffix array for surface... Using C indexer to build suffix array index/ted.surface Corpus read: 573804 words. Sorting suffix array... Sorting done! Saving... -- Error opening corpus/suffix file for reading! Building suffix array for syn... Using C indexer to build suffix array index/ted.syn Corpus read: 573804 words. Sorting suffix array... Sorting done! Saving...
Pensez-vous pouvoir m'aider?
Enfin comment cela se passe t'il si on veut changer de corpus?