Bonjour,
Unitex 3.0 a introduit la fonctionnalité offset,
(option --input_offsets et/ou --output_offsets de Normalize, Tokenize, Unxmlize, Concord, Fst2Txt de mémoire)
J’ai eu plusieurs retour m’indiquant que cette fonctionnalité est extrêmement utile mais avec parfois des erreurs qui se produisent lorsque les fichiers offset se transmettent de traitement en traitement.
J’ai l’impression que, comme souvent, le plus difficile est de mettre la main sur des exemples (et si possible des exemples réduits à des tailles raisonnable) permettant de mettre en évidence les éventuels erreurs de calcul.
Est-ce que des lecteurs de cette liste ont déjà (ou pourraient) utiliser cette fonctionnalité et contribuer à la détection des erreurs ?
A bientôt
Gilles Vollant