Quel analyzer

23 views
Skip to first unread message

Inci Compo

unread,
Apr 5, 2015, 10:18:04 AM4/5/15
to elastics...@googlegroups.com
Bonjour
Quel analyzer mettre lorsque le contenu vient d'une banque de données (différentes sources dont eux même contiennent des contenus de différentes langues sans marqueur permettant d'identifier)

Merci

Jérôme Mainaud

unread,
Apr 5, 2015, 11:44:07 AM4/5/15
to elastics...@googlegroups.com

Bonjour,

Dans ce cas, l' analyseur par défaut est un bon compromis. Il découpe correctement les mots mais ne fait pas de lemmatisation. Il peut être intéressant cependant de lui adjoindre un antidictionnaire qui regroupe les mots vides des langues qui seront présentes.

Jérôme Mainaud
jer...@mainaud.com

--
--
---
Vous pouvez également poster et consulter les réponses en anglais sur le groupe Elasticsearch https://groups.google.com/group/elasticsearch
 
Si vous avez également posté votre question sur la mailing list elasti...@googlegroups.com, merci d'indiquer ici le lien vers cette discussion pour faciliter le suivi.
 
Twitter : @ElasticsearchFR https://twitter.com/#!/ElasticsearchFR
Site web (English) : http://www.elasticsearch.org/
---
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes "Elasticsearch FR".
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, envoyez un e-mail à l'adresse elasticsearch-...@googlegroups.com.
Pour envoyer un message à ce groupe, envoyez un e-mail à l'adresse elastics...@googlegroups.com.
Visitez ce groupe à l'adresse http://groups.google.com/group/elasticsearch-fr.
Cette discussion peut être lue sur le Web à l'adresse https://groups.google.com/d/msgid/elasticsearch-fr/6886eb7d-466e-4052-b8ee-ff55a3a12d9c%40googlegroups.com.
Pour obtenir davantage d'options, consultez la page https://groups.google.com/d/optout.

David Pilato

unread,
Apr 5, 2015, 4:41:20 PM4/5/15
to elastics...@googlegroups.com
Peux tu préciser Jérome comment fonctionne un Anti dictionnaire et comment s'en servir dans le contexte d'elasticsearch ?

Jamais entendu parler de ça donc très intéressé !

Merci

--
David ;-)
Twitter : @dadoonet / @elasticsearchfr / @scrutmydocs

Jérôme Mainaud

unread,
Apr 5, 2015, 4:59:06 PM4/5/15
to elastics...@googlegroups.com

C'est tout simplement le nom "savant" du stop filter.
Autrement dit, c'est une liste de mots qui doivent être ignoré à l'indexation.
Mais je pense que tu sais t'en servir :-)

Jérôme Mainaud
jer...@mainaud.com

Reply all
Reply to author
Forward
0 new messages