Bonjour,
Voici un fichier (freqlettres.txt) qui contient les fréquences d'apparition des lettres par position (pondérées par la proba d'apparition des mots à l'écrit).
- Première colonne: fréquence cumulée;
- Deuxième colonne: lettre,
- Troisième colonne: position sequentielle dans le mot.
Ces nombres sont obtenus, à partir des colonnes `ortho` et `freqlivres` de la table `Lexique383.tsv`, avec le script `freq_bypos.sh` joint (mac ou linux).
Si par exemple vous voulez savoir la distribution de probabilité des lettres par position, il vous faut trier par position, et normaliser par la somme des fréquences.