Message from discussion
Versionning vs taille de l'index
Received: by 10.236.153.5 with SMTP id e5mr20896819yhk.5.1335634914250;
Sat, 28 Apr 2012 10:41:54 -0700 (PDT)
X-BeenThere: elasticsearch-fr@googlegroups.com
Received: by 10.236.84.232 with SMTP id s68ls3668043yhe.5.gmail; Sat, 28 Apr
2012 10:41:53 -0700 (PDT)
MIME-Version: 1.0
Received: by 10.236.75.42 with SMTP id y30mr468706yhd.7.1335634913720; Sat, 28
Apr 2012 10:41:53 -0700 (PDT)
Authentication-Results: ls.google.com; spf=pass (google.com: domain of
antoine....@gmail.com designates internal as permitted sender)
smtp.mail=antoine....@gmail.com; dkim=pass
header...@gmail.com
Received: by c4g2000yqj.googlegroups.com with HTTP; Sat, 28 Apr 2012 10:41:53
-0700 (PDT)
Date: Sat, 28 Apr 2012 10:41:53 -0700 (PDT)
In-Reply-To: <CAJXyu8mt1Qu-sdbDMx8eQZciD5yjBC3BOzgCKe3-yL48BUzPtg@mail.gmail.com>
References: <155dfdbc-ae85-4165-b72f-b00fc18352a2@d20g2000vbh.googlegroups.com>
<14D3CA8C-0119-4E8B-9A5E-6061A0371965@gmail.com> <CAJXyu8mt1Qu-sdbDMx8eQZciD5yjBC3BOzgCKe3-yL48BUzPtg@mail.gmail.com>
User-Agent: G2/1.0
X-HTTP-UserAgent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.19
(KHTML, like Gecko) Chrome/18.0.1025.162 Safari/535.19,gzip(gfe)
Message-ID: <5d115ca5-45f1-40b3-b686-4445ccc055a9@c4g2000yqj.googlegroups.com>
Subject: Re: Versionning vs taille de l'index
From: Antoine <antoine....@gmail.com>
To: Elasticsearch FR <elasticsearch-fr@googlegroups.com>
Content-Type: text/plain; charset=windows-1252
Content-Transfer-Encoding: quoted-printable
Merci David et J=E9r=F4me pour votre r=E9ponse. Il semblerait que vous ayez
raison. Le versionning d'ES fonctionne similairement =E0 celui
d'Hibernate.
Avec un coll=E8gue, nous avons effectu=E9 quelques tests =E0 partir d'un
article d=E9di=E9 au versionning post=E9 sur le blog d'ES :
http://www.elasticsearch.org/blog/2011/02/08/versioning.html
Techniquement, lorsqu'une nouvelle version du document est index=E9e, ES
cr=E9e un nouvel index et supprime le pr=E9c=E9dent index. D'apr=E8s l'outi=
l
Luke permettant de consulter un index Lucene, ES le marque comme
DELETED. Le soucis est que Lucene ne prends pas toujours en compte la
suppression du pr=E9c=E9dent index, et plus particuli=E8rement lorsque le
m=EAme document est mis =E0 jour de mani=E8re tr=E8s rapproch=E9. De ce fai=
t, le
scoring Lucene (Similarity) est fauss=E9 au niveau du calcul de l'IDF
car le maxDocs est sur=E9valu=E9. Pour notre projet, nous pensons
d=E9sactiver l'idf en suivant les indications de Shay Banon sur la liste
de diffusion officielle :
https://groups.google.com/group/elasticsearch/browse_thread/thread/c0136702=
bfa88f1/252eb86bf8dffba1?lnk=3Dgst&q=3Dsimilarity#252eb86bf8dffba1
Antoine
On 26 avr, 22:44, J=E9r=F4me Mainaud <jer...@mainaud.com> wrote:
> Il me semble aussi que le num=E9ro de version ne sert que pour effectuer =
une
> verrou optimiste et que seule la derni=E8re version est conserv=E9e.
>
> J=E9r=F4me Mainaud
> Le 26 avr. 2012 21:29, "Elasticsearch FR" <elasticsearc...@gmail.com> a
> =E9crit :
>
>
>
>
>
>
>
> > Elasticsearch ne conserve pas les n versions du document =E0 ma connais=
sance.
>
> > David ;-)
> > Twitter : @dadoonet / @elasticsearchfr
>
> > Le 26 avr. 2012 =E0 21:27, Antoine <antoine....@gmail.com> a =E9crit :
>
> > > Bonjour =E0 toute la communaut=E9 francophone d=92ElasticSearch,
>
> > > Bon all=E9, je me lance pour une premi=E8re question sur cette liste =
de
> > > diffusion !!
>
> > > Voici le contexte : j=92aimerais utiliser la fonctionnalit=E9 de
> > > versionning pour g=E9rer la concurrence d=92acc=E8s avec approche
> > > optimiste :http://www.elasticsearch.org/guide/reference/api/index_.ht=
ml
> > > Fonctionnellement, je n=92ai pas besoin d=92acc=E9der aux versions pl=
us
> > > anciennes d=92un document index=E9. Qui plus est, pour des probl=E9ma=
tiques
> > > de performance, j=92aimerais avoir un fichier d=92index Lucene le plu=
s
> > > petit possible.
>
> > > A votre connaissance, y=92a-t-il moyen de param=E9trer ElasticSearch =
pour
> > > qu=92il ne conserve que la version la plus r=E9cente du document inde=
x=E9 ?
> > > ou bien les N derni=E8res versions ? (ce qui reviendrait au m=EAme).
> > > Sinon, existe-t-il un m=E9canisme pour purger les anciennes versions =
?
>
> > > Merci d=92avance pour vos =E9claircissements,
>
> > > Antoine
>
> > > --
> > > ---
> > > Vous pouvez =E9galement poster et consulter les r=E9ponses en anglais=
sur le
> > groupe Elasticsearchhttps://groups.google.com/group/elasticsearch
>
> > > Si vous avez =E9galement post=E9 votre question sur la mailing list
> > elasticsearch@googlegroups.com, merci d'indiquer ici le lien vers cette
> > discussion pour faciliter le suivi.
>
> > > Twitter : @ElasticsearchFRhttps://twitter.com/#!/ElasticsearchFR
> > > Site web (English) :http://www.elasticsearch.org/
>
> > --
> > ---
> > Vous pouvez =E9galement poster et consulter les r=E9ponses en anglais s=
ur le
> > groupe Elasticsearchhttps://groups.google.com/group/elasticsearch
>
> > Si vous avez =E9galement post=E9 votre question sur la mailing list
> > elasticsearch@googlegroups.com, merci d'indiquer ici le lien vers cette
> > discussion pour faciliter le suivi.
>
> > Twitter : @ElasticsearchFRhttps://twitter.com/#!/ElasticsearchFR