Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Soundex français pour Lifelines

40 views
Skip to first unread message

Bernard

unread,
May 24, 2012, 6:45:09 PM5/24/12
to
Bonjour Patrick, bonjour à tous,

Je crois me souvenir qu'un travail avait été fait pour adapter le
"soundex" de Tom Wetmore, pour qu'il convienne aux prononciations
francophones. Où trouver les librairies et programmes qui conviennent ?
Où trouver une doc pour l'installation ?

J'utilise Lifelines 3.062 sous Linux.

Merci d'avance pour votre aide,

Bernard

Bernard

unread,
Jun 5, 2012, 8:13:06 PM6/5/12
to
Aucune réponse ni commentaire ?

Est-ce à dire que plus personne ne s'intéresse plus à 'Lifelines' ?

Devant l'absence de réaction, j'ai un peu plus réfléchi au problème, que
je croyais résolu depuis longtemps.

Et je pense avoir trouvé une solution... quoiqu'il me faudra sans doute
évaluer les résultats sur le long terme. Si d'autres personnes
intéressées pouvaient faire la même manip, je pense qu'il serait
intéressant de comparer les résultats.

La modif que j'ai faite, ne se peut faire qu'avec un Lifelines compilable
d'après un tarball, et donc ce n'est pas possible avec un .rpm ou
un .deb. Sachons bien qu'avec n'importe quelle distribution Linux, il n'y
a aucune obligation à faire usage des "packages", et qu'on trouve presque
toujours à télécharger un tarball à compiler. D'ailleurs, la version de
Lifelines (3,062) dont je dispose n'est - à ma connaissance - disponible
que sous cette forme. Je puis la communiquer à quiconque en ferait la
demande et ne l'aurait pas trouvée à télécharger ailleurs.

Après décompression et désarchivage, vous obtenez un répertoire:

/home/user/

Ce dossier comprend des sous-répertoires. Aller dans ...lifelines-3.0.62/
src/gedlib et ouvrez le fichier avec l'éditeur de texte de votre
préférence (ici c'est vim)

'soundex.c'

Ce fichier fait 151 lignes. Je n'en recopie ici que la partie qui nous
concerne, et que vous n'aurez aucun mal à retrouver :

********************************
{

/* English Language (Default) */

switch (letter) {

case 'B': case 'P': case 'F': case 'V':

newsx = '1'; break;

case 'C': case 'S': case 'K': case 'G':

case 'J': case 'Q': case 'X': case 'Z':

newsx = '2'; break;

case 'D': case 'T':

newsx = '3'; break;

case 'L':

newsx = '4'; break;

case 'M': case 'N':

newsx = '5'; break;

case 'R':

newsx = '6'; break;

default: /* new stays zero */

break;

}

***********************************

Il s'agit, avant de faire (refaire) la compilation de Lifelines, de
modifier ce fichier, et remplacer les paramètres du soundex anglophone
par ceux du soundex francophone, comme ci-après :

{

/* English Language (Default) */

/* Algorithm modified to French Language Language by
Bernard DEBREIL June 5, 2012 */

switch (letter) {

case 'B': case 'P':

newsx = '1'; break;

case 'C': case 'K':

case 'Q':

newsx = '2'; break;

case 'D': case 'T':

newsx = '3'; break;

case 'L':

newsx = '4'; break;

case 'M': case 'N':

newsx = '5'; break;

case 'R':

newsx = '6'; break;

case 'G': case 'J':

newsx = '7'; break;

case 'X': case 'Z': case 'S':

newsx = '8';break;

case 'F': case 'V':

newsx = '9';break;

default: /* new stays zero */

break;

}

}
*********************************************

Une fois cette séquence insérée dans le fichier 'soundex.c' à la place de
l'ancienne, il faut compiler Lifelines. Lisez bien le fichier INSTALL.
Votre Linux doit être équipé de libncursesw5-dev, gettext, gettext-base
etc... Si vous avez fait précédemment une compilation ratée dans le
répertoire

...lifelines-3,0,62/

il faut nettoyer:

$ 'make clean'

Puis:

$ ./configure (ou sh ./configure)

$ make

et, pour finir, s'il n'y a pas d'erreurs de compilation :

# make install (sous root ou superuser)
Ensuite vous cherchez le fichier de configuration. Généralement il se
trouve dans

/home/user/lifelines-3.0.62/.linesrc

Modifiez le, choisissez les répertoires où vous allez mettre vos
databases, vos outputs, vos reports... et le tour est joué !

Au fait, ceci étant fait, plus aucune de vos anciennes databases ne
fonctionnera convenablement. Le browse, 8 fois sur 10, ne trouvera plus
les patronymes que vous savez pourtant présents dans la base. Il faudra
donc virer vos LLDatabases, et les reconstruire à partir des Gedcom qui
ont permis de les faire à l'origine (ou à partir de gedcom que vous aurez
exporté à partir des bases actuelles). Après cette manip, chez moi tout
paraît satisfaisant, au moins au premier abord (car il y a moins d'une
heure que j'ai terminé ce travail).

Pour vos vérifications et tests, n'oubliez pas de faire usage du LLReport
intitulé:

'soundex-isfm.ll'

Avec un lifelines compilé avec le fichier soundex.c modifié comme
expliqué plus haut,

soundex-isfm

vous donne les nouveaux codes soundex, ceux du soundex francophone
(quoiqu'il leur ôte le dernier zéro,... je ne sais pas pourquoi, mais çà
n'a rien l'air de changer aux résultats obtenus)

Pour connaître, par un autre outil indépendant de Lifelines, les codes
soundex francophones, j'ai trouvé sur le web une contribution anonyme
sous forme du source d'un petit programme en Pascal. C'était du Turbo
Pascal, j'ai dû y apporter quelques modifications mineures afin de
pouvoir le compiler sur mon système par 'fpc' (Free Pascal compiler), où
il fonctionne parfaitement. Je puis communiquer sur demande le programme
compilé et/ou le source. Avec ce programme, on entre une chaîne de
caractères, et çà vous pond un code soundex francophone. Et là,
justement, les codes obtenus ont un zéro de plus à la fin... c'est à dire
un chiffre en plus que les codes anglophones... mais bon, on verra pour
la suite.

yves

unread,
Jun 6, 2012, 6:05:46 PM6/6/12
to
Le Wed, 06 Jun 2012 00:13:06 +0000, Bernard a écrit:

Bonjour,

> Aucune réponse ni commentaire ?

Patrick n'a plus posté ici depuis bien longtemps.
Il me semble hélas avoir vu passer des messages à ce sujet.

Cordialement,
--
Yves

Thierry Houx

unread,
Jun 8, 2012, 8:03:18 AM6/8/12
to
Bonjour,

Il semble que Patrick ait eu un grave problème de santé, ce qui explique
son mutisme. Je lui souhaite le meilleur rétablissement possible.
Le sujet Lifelines m'intéresse; toutefois, je suis actuellement pris par
ailleurs et n'ai que peu de temps à y consacrer.
D'ici une dizaine de mois, je serai en "retraite" et espère bien dégager
du temps pour renouer avec ces activités informatiques autour de la
généalogie.

Cordialement.
--
Thierry Houx (thierr...@free.fr)
Tourisme en Haute-Normandie, informatique libre et généalogie:
http://thierry.houx.free.fr/index.html
Webmestre du site http://www.geneacaux.org/ membre CGPCSM N°72-2576

Bernard

unread,
Jun 9, 2012, 10:27:55 AM6/9/12
to
Le Fri, 08 Jun 2012 14:03:18 +0200, Thierry Houx a écrit :

> Le 07/06/2012 00:05, yves a écrit :
>> Le Wed, 06 Jun 2012 00:13:06 +0000, Bernard a écrit:
>>
>> Bonjour,
>>
>>> Aucune réponse ni commentaire ?
>>
>> Patrick n'a plus posté ici depuis bien longtemps. Il me semble hélas
>> avoir vu passer des messages à ce sujet.
>>
>> Cordialement,
>
> Bonjour,
>
> Il semble que Patrick ait eu un grave problème de santé, ce qui explique
> son mutisme. Je lui souhaite le meilleur rétablissement possible. Le
> sujet Lifelines m'intéresse; toutefois, je suis actuellement pris par
> ailleurs et n'ai que peu de temps à y consacrer. D'ici une dizaine de
> mois, je serai en "retraite" et espère bien dégager du temps pour
> renouer avec ces activités informatiques autour de la généalogie.
>
> Cordialement.

Merci pour cette info. Patrick poste tout de même régulièrement les
"Conseils d'utilisation"... mais c'est sans doute fait automatiquement.
Je lui souhaite un prompt rétablissement, et j'espère qu'on le trouvera
bientôt en ligne.

Cordialement,

Bernard DEBREIL

gmi2a

unread,
Jun 9, 2012, 5:36:09 PM6/9/12
to
Le 25/05/2012 00:45, Bernard a écrit :
> Je crois me souvenir qu'un travail avait été fait pour adapter le
> "soundex" de Tom Wetmore, pour qu'il convienne aux prononciations
> francophones. Où trouver les librairies et programmes qui conviennent ?
> Où trouver une doc pour l'installation ?
>
> J'utilise Lifelines 3.062 sous Linux.

Bonsoir,

Plus grand monde, les vieux sont fatigués :-))
Regarde son site : http://patrick.texier.free.fr/
le http://www.genindre.org/ ne semble plus en place.




gmi2a

unread,
Jun 9, 2012, 5:40:40 PM6/9/12
to
Le 25/05/2012 00:45, Bernard a écrit :
> Je crois me souvenir qu'un travail avait été fait pour adapter le
> "soundex" de Tom Wetmore, pour qu'il convienne aux prononciations
> francophones. Où trouver les librairies et programmes qui conviennent ?
> Où trouver une doc pour l'installation ?
>
> J'utilise Lifelines 3.062 sous Linux.

Regarde un vieux post.
http://fr.comp.applications.genealogie.narkive.com/FDWoX51z/code-phonetique

Bernard

unread,
Jun 14, 2012, 4:38:44 AM6/14/12
to
Merci pour ce lien. Mais chez moi il ne mène nulle part ("502 Bad
Gateway...).

Mais le changement de paramètres que j'ai introduit dans le fichier
'soundex.c' du dernier lifelines package avant recompilation, paraît
donner satisfaction... à condition de ne pas faire usage des anciennes LL
databases (dont les patronymes sont associés aux codes soundex
anglophones) mais de les reconstruire à partir des gedcoms.

Je rappelle le mode de calcul des codes soundex :

Mettre le nom en majuscules non accentuées. Supprimer les espaces.
Supprimer toutes les voyelles ainsi que les H et W, et ce, sauf pour la
première lettre du mot. Ainsi, par exemple :

De La Jarretière devient DELAJARRETIERE puis DLJRRTR

et AUPETIT devient APTT

Ensuite, pour toutes les lettres qui restent dans la chaîne (sauf la
première à laquelle on ne touche pas), il s'agit de les remplacer par
leur valeur Soundex. Pour le Français :

B, P : 1
C, K, Q : 2
D, T : 3
L : 4
M, N : 5
R : 6
G, J : 7
X, Z, S : 8
F, V : 9

et pour l'anglais:

B, F, P, V : 1
C, G, J, K, Q, S, X, Z : 2
D, T : 3
L : 4
M, N : 5
R : 6

Et donc, pour les deux exemples ci-haut, cela donnerait, avec le codage
francophone :

DELAJARRETIERE ==> DLJRRTR ==> D476636

AUPETIT ==> APTT ==> A133

Etape suivante : supprimer les chiffres répétés, ce qui donne ici :

DELAJARRETIERE ==> DLJRRTR ==> D476636 ==> D47636

AUPETIT ==> APTT ==> A133 ==> A13

Dernière étape : si les codes obtenus contiennent plus de 4 éléments, on
ne conserve que les 4 les plus à gauche ; si au contraire il y a moins de
4 éléments, on complète par des zéros, ce qui aboutit aux codes FrSoundex
suivants :

DELAJARRETIERE ==> DLJRRTR ==> D476636 ==> D47636 ==> D476

AUPETIT ==> APTT ==> A133 ==> A13 ==> A130

Denis Beauregard

unread,
Jun 14, 2012, 8:12:22 AM6/14/12
to
Le 14 Jun 2012 08:38:44 GMT, Bernard <bdeb...@teaser.fr> �crivait
dans fr.comp.applications.genealogie:

>Le Sat, 09 Jun 2012 23:40:40 +0200, gmi2a a �crit�:
>
>> Le 25/05/2012 00:45, Bernard a �crit :
>>> Je crois me souvenir qu'un travail avait �t� fait pour adapter le
>>> "soundex" de Tom Wetmore, pour qu'il convienne aux prononciations
>>> francophones. O� trouver les librairies et programmes qui conviennent ?
>>> O� trouver une doc pour l'installation ?
>>>
>>> J'utilise Lifelines 3.062 sous Linux.
>>
>> Regarde un vieux post.
>> http://fr.comp.applications.genealogie.narkive.com/FDWoX51z/code-
>phonetique
>
>Merci pour ce lien. Mais chez moi il ne m�ne nulle part ("502 Bad
>Gateway...).

Chez moi, il fonctionne. Essaie de recoller le lien dans le navigateur
au lieu de cliquer.


Denis

--
Denis Beauregard - g�n�alogiste �m�rite (FQSG)
Les Fran�ais d'Am�rique du Nord - www.francogene.com/genealogie--quebec/
French in North America before 1722 - www.francogene.com/quebec--genealogy/
Sur c�d�rom � 1780 - On CD-ROM to 1780

Patrick Texier

unread,
Aug 21, 2012, 4:22:40 AM8/21/12
to
Le Fri, 08 Jun 2012 14:03:18 +0200, Thierry Houx a �crit�:

> Il semble que Patrick ait eu un grave probl�me de sant�, ce qui explique
> son mutisme. Je lui souhaite le meilleur r�tablissement possible.

Effectivement, j'ai eu un avc il y a 14 mois.
--
Patrick Texier

vim:syntax=mail:ai:ts=4:et:tw=72

Yannick VOYEAUD

unread,
Aug 21, 2012, 9:24:59 AM8/21/12
to
Le 21/08/2012 10:22, Patrick Texier a écrit :
> Le Fri, 08 Jun 2012 14:03:18 +0200, Thierry Houx a écrit :
>
>> Il semble que Patrick ait eu un grave problème de santé, ce qui explique
>> son mutisme. Je lui souhaite le meilleur rétablissement possible.
>
> Effectivement, j'ai eu un avc il y a 14 mois.
>
Bonjour à tous,

Et surtout à Patrick que nous sommes heureux de retrouver parmi nous.

Amitiés

--
Yannick VOYEAUD
Nul n'a droit au superflu tant que chacun n'a pas son nécessaire
(Camille JOUFFRAY 1841-1924, maire de Vienne)
http://www.voyeaud.org

Denis Beauregard

unread,
Aug 21, 2012, 9:35:21 AM8/21/12
to
Le Tue, 21 Aug 2012 10:22:40 +0200, Patrick Texier
<p.te...@alussinan.org> �crivait dans
fr.comp.applications.genealogie:

>Le Fri, 08 Jun 2012 14:03:18 +0200, Thierry Houx a �crit�:
>
>> Il semble que Patrick ait eu un grave probl�me de sant�, ce qui explique
>> son mutisme. Je lui souhaite le meilleur r�tablissement possible.
>
>Effectivement, j'ai eu un avc il y a 14 mois.

Bon retour parmi nous !

P.S. Les anciens sont nombreux dans Facebook !

Pascal DUCHENE

unread,
Aug 21, 2012, 10:15:39 AM8/21/12
to
Le Tue, 21 Aug 2012 10:22:40 +0200, Patrick Texier
<p.te...@alussinan.org> a �crit :

>Le Fri, 08 Jun 2012 14:03:18 +0200, Thierry Houx a �crit�:
>
>> Il semble que Patrick ait eu un grave probl�me de sant�, ce qui explique
>> son mutisme. Je lui souhaite le meilleur r�tablissement possible.
>
>Effectivement, j'ai eu un avc il y a 14 mois.


heureux de te revoir parmi nous



--
space ivaders
les doigts de pieds en eventail

phil

unread,
Sep 1, 2012, 3:54:42 PM9/1/12
to
Le mardi 21 août 2012 à 10:22 +0200, Patrick Texier a écrit :
> Le Fri, 08 Jun 2012 14:03:18 +0200, Thierry Houx a écrit :
>
> > Il semble que Patrick ait eu un grave problème de santé, ce qui explique
> > son mutisme. Je lui souhaite le meilleur rétablissement possible.
>
> Effectivement, j'ai eu un avc il y a 14 mois.

Content que tu reprennes du service

Thierry Houx

unread,
Sep 15, 2012, 4:03:34 AM9/15/12
to
Le 21/08/2012 10:22, Patrick Texier a �crit :
> Le Fri, 08 Jun 2012 14:03:18 +0200, Thierry Houx a �crit :
>
>> Il semble que Patrick ait eu un grave probl�me de sant�, ce qui explique
>> son mutisme. Je lui souhaite le meilleur r�tablissement possible.
>
> Effectivement, j'ai eu un avc il y a 14 mois.

Heureux de te voir de retour; et j'esp�re bien remis de cette �preuve oh
combien difficile.

Bien cordialement.
--
Thierry Houx (thierr...@free.fr)
Tourisme en Haute-Normandie, informatique libre et g�n�alogie:
0 new messages