Bonjour,J'ai une question concernant la réconciliation des positions de match données dans le fichier concord.offsets et des match donnés dans le fichier concord.ind.Comment retrouver les positions de match dans le texte original pour les mots composés dans le concord.ind ?Voici l'exemple qui ne fonctionne pas (fichiers concord.ind et concord.offsets joints).Le texte est : "cancer du rectum sai"Et voici ma méthode pour réconcilier les positions de match :- J'itère sur les match trouvés dans concord.ind- J'itère sur les positions A B dans concord.offsets (positions dans le texte original)- Si l'un des ID du mot dans concord.ind est différent des ID précédents, je passe à la position suivante dans concord.offsetstermID from to term lineID-8310922913896777417 0 6 cancer 1-7786143066220798086 0 6 cancer 16922496444877256695 0 6 cancer 1-7786143066220798086 0 6 cancer 11594337135076683083 7 9 du 1-2338339785243132358 7 9 du 1-4454175685498229259 7 9 du 1235403431773756686 7 9 du 15551697063349540978 7 9 du 1-5306134730382258828 7 9 du 1391554790895645142 7 9 du 11078567423265359515 7 9 du 1-6314445134243994414 7 9 du 12998185714986388907 7 9 du 124964792180944916 7 9 du 13060221448903768654 10 16 cancer du rectum 1-5550434980473380055 10 16 cancer du rectum 1-2317174096351890937 10 16 cancer du rectum 14695142649738281102 10 16 rectum 1344934841869736741 10 16 rectum 13060221448903768654 17 20 cancer du rectum 16933238188653628273 17 20 cancer du rectum sai 1-6956188436807987100 17 20 rectum sai 1-4883830636129614437 17 20 sai 1Il me manque clairement des étapes.Comment procéder ?Merci à vous,Stella
De mémoire
Concord.ind est produit par locate
L’outils concord produit concord.txt à partir de concord.ind en mettant les bonnes infos d’offset
Nous pouvons nous telephoner 0680109192
De : unitex-...@googlegroups.com [mailto:unitex-...@googlegroups.com] De la part de Stella Zevio
Envoyé : vendredi 19 mai 2017 18:00
À : Unitex-GramLab
Objet : [Unitex-GramLab] Re: Concord.ind, concord.offsets, positions dans le texte original et mots composés
--