Je recherche le genre dans les langues.
J'ai remarqué que certains mots du corpus Lexique 3.83 n'ont pas de codage de genre, même s'ils sont genrés, par exemple « ancêtres » et « gens » (et « l' »). J'ai le sentiment que pour certains mots, c'est parce qu'ils peuvent être à la fois féminins et masculins. Ne devrait-il pas y avoir un code pour «fm» quand un mot peut être féminin ou masculin, par exemple « enfant » ?
Ces mots sont codés par genre: mienne, mien, miens, miennes, tienne, tien, tiennes, sienne, sien, siennes, siens
Mais ces mots ne sont pas codés par genre: tiens, ma, mon, ta, ton, sa, son
Et ces mots n'ont pas de codage cgram: à tue-tête, à cloche-pied, à tire-larigot, à brûle-pourpoint, à rebrousse-poil, team, o, à touche-touche
J'aimerais en savoir plus sur la façon dont les codes de fréquence sont calculés. Y a-t-il une description de cela quelque part?
Je veux comprendre un peu plus afin de m'assurer que les résultats de mes recherches sont aussi corrects et complets que possible.
J'apprécie beaucoup les efforts de ceux qui ont élaboré ce magnifique corpus.