impossible de lancer mwetoolkit :(

13 views
Skip to first unread message

emmanuelle...@gmail.com

unread,
Nov 18, 2016, 11:22:07 AM11/18/16
to mwetoolkit
Bonjour,

Je travaille avec Muntsa Padro à Grenoble, qui d'ailleurs vous passe le bonjour!

Nous sommes à la recherche d'un mmoyen d'extraire automatiquement les mwe selon des nouveaux corpus de domaine. C'est pour ça qu'on s'est tourné vers votre toolkit qui nous à l'air super. Simplement, j'essaie à répétition de suivre le "quick start" et impossible de lire le corpus d'exemple. Voici le code d'erreur que j'obtiens :

$ python index.py -v -i index/ted ../ted-en-sample.conll
INFO: Verbose mode on
ted-en-sample.conll: INFO: Found directive for filetype `CONLL`
ted-en-sample.conll:14: WARNING: Empty/missing value for word attribute `syn`
ted-en-sample.conll:14: .......: (Suppressing further warnings of this type)
~~> Processing entity number 30000 (99%)
Building suffix array for lemma...
Using C indexer to build suffix array index/ted.lemma
Corpus read: 573804 words.
Sorting suffix array...
Sorting done! Saving...
-- Error opening corpus/suffix file for reading!
Building suffix array for pos...
Using C indexer to build suffix array index/ted.pos
Corpus read: 573804 words.
Sorting suffix array...
Sorting done! Saving...
-- Error opening corpus/suffix file for reading!
Building suffix array for surface...
Using C indexer to build suffix array index/ted.surface
Corpus read: 573804 words.
Sorting suffix array...
Sorting done! Saving...
-- Error opening corpus/suffix file for reading!
Building suffix array for syn...
Using C indexer to build suffix array index/ted.syn
Corpus read: 573804 words.
Sorting suffix array...
Sorting done! Saving...



Pensez-vous pouvoir m'aider?

Enfin comment cela se passe t'il si on veut changer de corpus?

Merci beaucoup.
Emmanuelle Dusserre
Reply all
Reply to author
Forward
0 new messages