Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Longueur et fréquence des mots, loi de Zipf

142 views
Skip to first unread message

Al-Kashi

unread,
Mar 8, 2002, 3:04:10 PM3/8/02
to
Bonjour,

J'ai appris qu'il existait une relation entre la fréquence des mots
et leur longueur. En effet, on observe que plus un mot est courant,
plus il est court. On aurait même la relation suivante :

longueur * fréquence = constante. (Loi de Zipf)

Voilà l'objet de ma question : est-ce que la valeur de cette
constante a déjà été calculée pour la langue française ? Je cherche un
site où je pourrais en apprendre plus... voire qui donnerait cette
valeur.

J'ai aussi lu qu'il existait une relation similaire entre la
fréquence des mots et leur "ordre d'apparition dans un classement où
ces mots seraient rangés par ordre décroissant de fréquence". Et là,
je n'ai pas bien compris...!

Quelqu'un pourrait-il éclairer un peu plus ma lanterne ?

--
Al-Kashi.
Enlevez "nospam" à mon adresse pour me répondre personnellement.
Merci.

Pascal PALET

unread,
Mar 8, 2002, 3:30:06 PM3/8/02
to
bonjour

personnellement je ne ppuis te répondre quand à ta dernière question mais je
pense qu'il faut voir ici une évidence car les mots les plus usités sont
ceux qui nous viennent le plus vite à l'esprit, donc en premier lorsque nous
tentons de les classer.

Il en va de même pour les lettres, d'où les présentations différentes des
claviers d'ordianteur selon notre langue maternelle et l'utilisation des
lettres.

"Al-Kashi" <alkashi...@nordnet.fr> a écrit dans le message news:
a6b5fb$u38$1...@news.nordnet.fr...

Yvon Henel

unread,
Mar 8, 2002, 3:51:43 PM3/8/02
to
Al-Kashi a écrit :

> Bonjour,
>
> J'ai appris qu'il existait une relation entre la fréquence des mots
> et leur longueur. En effet, on observe que plus un mot est courant,
> plus il est court. On aurait même la relation suivante :
>
> longueur * fréquence = constante. (Loi de Zipf)

Je traduis à la volée quelques lignes du « how nature works » de Per Bak
(Springer 1996) :
Dans un livre remarquable /Human Behaviour and the Principal of Least
Effort/ qui parut en 1949, le Professeur George Kingsley Zipf de
l'Université de Harvard, fit de nombreuses observations frappantes de
quelques régularités simples dans les systèmes d'origine humaine. [je coupe
un exemple sur les villes classées par nombre d'habitants]
Zipf compta également combien de fois un mot donné était utilisé dans une
oeuvre littéraire telle que le /Ulysses/ de James Joyce ou dans une
collection de journaux américains. Le dixième mot (par ordre de fréquence)
apparaissait 2653 fois. Le 20e apparaissait 1311 fois. Le 20 000e mot était
utilisé une seule fois. [... renvoi à une figure à échelle logarithmique
rang du mot/fréquence où l'on voit apparaître une droite quasi parfaite]
Il importe peu que les données soient tirées de journaux, de la Bible ou
d'/Ulysses/, la courbe est la même. La régularité exprimée par la droite
dans le graphique logarithmique donnant la fréquence en fonction du rang,
droite dont la pente est proche de l'unité est appelée loi de Zipf.
--
Hypatie

Clotilde Chaland

unread,
Mar 9, 2002, 5:31:49 AM3/9/02
to
Pascal PALET <judi...@club-internet.fr> wrote:
>
> personnellement je ne ppuis te répondre quand à ta dernière question mais je
> pense qu'il faut voir ici une évidence car les mots les plus usités sont
> ceux qui nous viennent le plus vite à l'esprit, donc en premier lorsque nous
> tentons de les classer.
>
> Il en va de même pour les lettres, d'où les présentations différentes des
> claviers d'ordianteur selon notre langue maternelle et l'utilisation des
> lettres.

J'ignore qui a décidé et selon quels critères, de la disposition des
touches sur un clavier, mais je ne suis pas tout à fait d'accord avec
vous. Pour moi, par exemple, qui ai un clavier AZERTY et qui suis
droitière, les lettres les plus fréquemment utilisées sont celles qui
tombent sous ma main gauche. Et je puis vous assurer que certains jours
où j'ai dû beaucoup tapoter, j'ai les doigts de la main gauche en
bouillie (surtout le quinquin gauche qui tape le a et le é, alors que le
quinquin droit n'est sollicité que pour le m et le p).

--
©lõ



Yvon Henel

unread,
Mar 9, 2002, 8:05:42 AM3/9/02
to
Clotilde Chaland a écrit :

> Pascal PALET <judi...@club-internet.fr> wrote:
[coupure]


>> Il en va de même pour les lettres, d'où les présentations différentes des
>> claviers d'ordianteur selon notre langue maternelle et l'utilisation des
>> lettres.
>
> J'ignore qui a décidé et selon quels critères, de la disposition des
> touches sur un clavier, mais je ne suis pas tout à fait d'accord avec
> vous. Pour moi, par exemple, qui ai un clavier AZERTY et qui suis
> droitière, les lettres les plus fréquemment utilisées sont celles qui
> tombent sous ma main gauche. Et je puis vous assurer que certains jours
> où j'ai dû beaucoup tapoter, j'ai les doigts de la main gauche en
> bouillie (surtout le quinquin gauche qui tape le a et le é, alors que le
> quinquin droit n'est sollicité que pour le m et le p).

Si la mémoire ne me fait défaut, le clavier AZERTY est un clavier qui
devait être anglo-français. Une commission internationale (les deux pays
sus-sous-entendus) avait été chargée d'élaborer un clavier convenant aux
deux langues et tenant compte du fait que les dactylos aguerries devenaient
trop rapides pour les malheureux mécanismes des claviers de l'époque.
Lorsque la commission eut statué, la France adopta le clavier «
international » et la perfide Albion choisit de l'ignorer et d'adopter sa
propre norme. L'habitude a fait le reste.
L'histoire est jolie, elle montre nos voisins d'outre-Manche sous leur jour
habituel (je plaisante !!!) mais est-elle vraie ? Je crois qu'au moins
l'argument de la vitesse de frappe est avéré : il fallait ralentir la
frappe pour que ne se produise pas sans cesse des salades de marteaux.

--
Hypatie

Paul Rivaud

unread,
Mar 9, 2002, 10:21:01 AM3/9/02
to

"Yvon Henel" <Yvon....@wanadoo.fr> a écrit

> Je crois qu'au moins
> l'argument de la vitesse de frappe est avéré : il fallait ralentir la
> frappe pour que ne se produise pas sans cesse des salades de marteaux.
>

Confirmé sur :
http://www.linux-france.org/prj/jargonf/A/AZERTY.html
Clavier français standard, AZERTY étant les premières touches de la
deuxième ligne du clavier en partant du haut.
« On dit parfois qu'il a été conçu pour accélérer la frappe des
dactylos, mais c'est faux. Il fut conçu pour ralentir la frappe, dont la
vitesse excessive, sur les premières machines à écrire, entraînait le
blocage des marteaux. En plaçant loin les unes des autres les lettres
formant souvent des paires, on évitait ce problème. »


cwe...@gmx.net

unread,
Mar 9, 2002, 3:15:32 PM3/9/02
to
On Sat, 9 Mar 2002 16:21:01 +0100, "Paul Rivaud" <p.riv...@free.fr>
wrote:

La première machine à écrire fut due à l'Américain Christopher Latham
Sholes et à ses associés (1867). L'ordre initial des touches était
alphabétique. L'un des inconvénients de cette disposition était le
blocage des marteaux, de sorte que l'on éloigna les unes des autres
les touches les plus utilisées en anglais, aboutissant au clavier
QWERTY. Je ne connais pas la genèse du clavier AZERTY. Par contre, je
sais que l'Américain August Dvorak mit au point en 1932 un nouveau
clavier sur lequel on se servait surtout d'une rangée de touches
(« home row », 70% des frappes) et où la main droite était plus
sollicitée (56%) que la main gauche (44%). Malgré les avantages du
clavier Dvorak et les bien meilleures performances qu'il permettait,
il ne fut pas adopté et ne pouvait parfois, il y a encore 20 ans, être
obtenu que sur demande expresse du client. J'ignore s'il en existe
une adaptation française.

CW (mail : sans "NS")

Ru Chri

unread,
Mar 10, 2002, 1:53:25 AM3/10/02
to
clo, où prenez-vous donc ce 'quinquin' que, moi, nf (non-francophone)
curieux de mots, je n'arrive pas à dépister malgré les recherches que je me
suis tapées...........
ru chri


"Clotilde Chaland" <Clotilde...@imag.fr> schreef in bericht
news:1f8s1fn.65...@chaland.ppp.imag.fr...

Clotilde Chaland

unread,
Mar 10, 2002, 1:20:30 AM3/10/02
to
Ru Chri <lerev...@invalid.com> wrote:

> clo, où prenez-vous donc ce 'quinquin' que, moi, nf (non-francophone)
> curieux de mots, je n'arrive pas à dépister malgré les recherches que je me
> suis tapées...........
> ru chri

Oui, pardon, j'aurais dû traduire.
Il s'agit de mon petit doigt.

--
©lõ



Ru Chri

unread,
Mar 10, 2002, 3:38:45 AM3/10/02
to
pas grave, merci de m'avoir confirmé ce dont je me doutais déjà un peu
ru chri

"Clotilde Chaland" <Clotilde...@imag.fr> schreef in bericht

news:1f8tlql.1a8...@chaland.ppp.imag.fr...

Pierre Hallet

unread,
Mar 10, 2002, 5:33:34 AM3/10/02
to
Ru Chri wrote:
>
> clo, où prenez-vous donc ce 'quinquin' que, moi, nf
> (non-francophone) curieux de mots, je n'arrive pas
> à dépister malgré les recherches que je me
> suis tapées...........
> ru chri

Cherchez en Google « quinquin doigt » :

<perso.club-internet.fr/jpicard/html/longueDame.htm> :

Les cinq doigts de la main sont : gros det, laridet,
longue dame, jean du siau et le courtiaud ou quinquin.

Pierre Hallet

Ru Chri

unread,
Mar 11, 2002, 4:16:50 AM3/11/02
to
il se trouve quand même que je viens de faire, après coup, la trouvaille que
voici (harrap's french-english dict.of slang and colloquialisms): quinquin,
p'tit quinquin = ch'timi (native of northern france, northener)

"Ru Chri" <lerev...@invalid.com> schreef in bericht
news:a6f617$rno$1...@cyan.nl.gxn.net...

Isabelle Depape Hamey

unread,
Mar 11, 2002, 5:20:58 AM3/11/02
to
Ru Chri a écrit :

> il se trouve quand même que je viens de faire, après coup, la trouvaille que
> voici (harrap's french-english dict.of slang and colloquialisms): quinquin,
> p'tit quinquin = ch'timi (native of northern france, northener)

Lorsque Pierre Maurois était maire de Lille, on le surnommait « gros Quinquin
»...

Vous trouverez le texte de « Le p'tit Quinquin » à l'adresse suivante :

http://beh.free.fr/npc/mus/quinquin.html

Vous pouvez également l'écouter à :

http://www.chtisansfrontiere.org/quinquin/inst.html

Bonne nuit,

Isabelle

Ru Chri

unread,
Mar 12, 2002, 1:59:58 AM3/12/02
to
bonjour isabelle,
arraché au sommeil il n'y a pas très longtemps (ce 'bonne nuit' m'avait
d'ailleurs fait brusquement redoubler d'attention et croire d'abord que vous
devriez bien vivre parmi nos antipodes), je vous remercie de m'avoir fait
découvrir ces sites intéressants ;
je vois du reste que le 'guide de flandre et artois mystérieux (nord) ' (éd.
presses-pocket) que j'ai, en parle aussi (p.159) .
une fois de plus, à côté de nos livres, le web se révèle très pratique !
ru chri


"Isabelle Depape Hamey" <ha...@free.fr> schreef in bericht
news:3C8C850A...@free.fr...

Ru Chri

unread,
Mar 12, 2002, 4:14:30 PM3/12/02
to
merci, pierre, pour votre message que, pour des raisons inexplicables, je
n'avais pas repérée plus tôt et que je trouve très utile.
ru chri

"Pierre Hallet" <pierre...@skynet.be> schreef in bericht
news:3C8B367E...@skynet.be...

Ru Chri

unread,
Mar 12, 2002, 4:18:43 PM3/12/02
to
prière de lire : repéré

"Ru Chri" <lerev...@invalid.com> schreef in bericht

news:a6lqv4$pam$1...@cyan.nl.gxn.net...

Ru Chri

unread,
Mar 19, 2002, 1:38:42 PM3/19/02
to

"Isabelle Depape Hamey" <ha...@free.fr> schreef in bericht
news:3C8C850A...@free.fr...
> Ru Chri a écrit :
>
> Vous trouverez le texte de « Le p'tit Quinquin » à l'adresse suivante :
>
> http://beh.free.fr/npc/mus/quinquin.html
>
> Vous pouvez également l'écouter à :
>
> http://www.chtisansfrontiere.org/quinquin/inst.html

Pour revenir au monde musical des enfants: je viens de voir un film
intitulé F...comme Fairbanks (1976) et c'est Miou-Miou qui y assure, devant
Patrick Dewaere et
d'une voix forte et incontournable, l'interprétation de ''Bateau sur
l'eau'' .
Le tout se laisse retrouver sur le site (c'est la première des 2 versions
données) :
http://www.momes.net/comptines/comptineseau.html
Le son est des plus modernes.
RC


FB

unread,
Mar 20, 2002, 12:47:44 PM3/20/02
to
"Al-Kashi" <alkashi...@nordnet.fr> wrote in message news:<a6b5fb$u38$1...@news.nordnet.fr>...

> Voilà l'objet de ma question : est-ce que la valeur de cette
> constante a déjà été calculée pour la langue française ? Je cherche un
> site où je pourrais en apprendre plus... voire qui donnerait cette
> valeur.

L'encyclopédie de la Pléiade, volume Linguistique, comprend un article
de Benoît Mandelbrot qui explique très bien la chose. Ce n'est pas en
ligne, mais doit pouvoir se trouver assez facilement en bibliothèque.

> J'ai aussi lu qu'il existait une relation similaire entre la
> fréquence des mots et leur "ordre d'apparition dans un classement où
> ces mots seraient rangés par ordre décroissant de fréquence". Et là,
> je n'ai pas bien compris...!

C'est un autre exemple dela loi de Zipf : rang x frequence = cste
En d'autre termes, le mot le plus fréquent se rencontre deux fois plus
que le deuxième, trois fois plus que le troisième etc.
C'est bien évidemment une approximation, mais on pourrait mesurer la
constante en reportant les mots sur un graphique rang-fréquence.

Ru Chri

unread,
Mar 21, 2002, 2:05:58 AM3/21/02
to

"FB" <ferd...@my-dejanews.com> schreef in bericht
news:3d76ba0.02032...@posting.google.com...

> "Al-Kashi" <alkashi...@nordnet.fr> wrote in message
news:<a6b5fb$u38$1...@news.nordnet.fr>...
>
> > Voilà l'objet de ma question : est-ce que la valeur de cette
> > constante a déjà été calculée pour la langue française ? Je cherche un
> > site où je pourrais en apprendre plus... voire qui donnerait cette
> > valeur.
>
> L'encyclopédie de la Pléiade, volume Linguistique, comprend un article
> de Benoît Mandelbrot qui explique très bien la chose. Ce n'est pas en
> ligne, mais doit pouvoir se trouver assez facilement en bibliothèque.

Juste une précision : ce volume s'intitule plus exactement ''Le langage'' .
RC

0 new messages