{JUG Trójmiasto} Spotkanie 29.04.2010 - Jakub Marchwicki "Lucene - w poszukiwaniu zaginionej informacji"

27 views
Skip to first unread message

Jakub Neumann

unread,
Apr 22, 2010, 10:56:15 AM4/22/10
to Trójmiasto JUG
Serdecznie zapraszamy na kolejne spotkanie Trójmiasto JUG, we czwartek
29.04.2010, godz. 17.30, aula 2, Wydział MFI UG, ul. Wita Stwosza 57,
Gdańsk. Wstęp oczywiście jak najbardziej wolny!

O Lucene opowiadał będzie Jakub Marchwicki, oto jego streszczenie:

"Lucene - w poszukiwaniu zaginionej informacji"

Sprawne wyszukiwanie... w codziennym zalewie informacji, odsiewanie
ziaren od plew to chyba jedna z najtrudniejszych rzeczy która nas
spotyka. Wyszukanie tego co 'kiedyś tam przeczytaliśmy' w jednym z
setek subskrybowanych 'feedów' RSS to jedna z największych bolączek
współczesnego człowieka (oczywiście poza chmurą pyłu znad Islandii
oraz drożejącym paliwem).

Na zbliżającej się prelekcji postaram się przybliżyć jedno z wielu
narzędzi wspomagające wyszukiwanie: bibliotekę Lucene. Jest to pełno-
tekstowy silnik indeksujący i wyszukujący. Mimo swoich niewątpliwych
zalet, jest to jedynie mały krok na naszej drodze to "Krainy
Zaginionej Informacji". Postaram się tę krainę przybliżyć.

Planuje omówić jak działa Lucene. Jak wygląda indeksowanie danych oraz
jak później możemy te dane przeszukiwać. O czym jeszcze należy
pamiętać przygotowując 'sercza' dla naszego systemu i jakie narzędzia
mogą nas w tym wspomóc. Dlaczego 'zaawansowane wyszukiwanie' nie jest
nikomu potrzebne i co można zrobić aby nie mieć poczucia że ktoś chce
nas obrazić pokazując nam ten obrazek: http://fusionovation.com/blogs/mpalmer/googleproduct.jpg

Zapraszam :-)
Kuba

--
Otrzymujesz tę wiadomość, ponieważ subskrybujesz grupę dyskusyjną Google o nazwie "Trójmiasto JUG".

Aby zamieszczać posty w tej grupie, wyślij e-mail na adres jug-tro...@googlegroups.com.
Aby anulować subskrypcję tej grupy, wyślij e-mail na adres jug-trojmiast...@googlegroups.com.
Aby uzyskać więcej informacji, odwiedź tę grupę pod adresem http://groups.google.com/group/jug-trojmiasto?hl=pl.

kuba.marchwicki

unread,
Apr 29, 2010, 3:48:45 PM4/29/10
to Trójmiasto JUG

On 22 Kwi, 16:56, Jakub Neumann <kuba.neum...@gmail.com> wrote:
> Serdecznie zapraszamy na kolejne spotkanie Trójmiasto JUG, we czwartek
> 29.04.2010, godz. 17.30, aula 2, Wydział MFI UG, ul. Wita Stwosza 57,
> Gdańsk. Wstęp oczywiście jak najbardziej wolny!
>
> O Lucene opowiadał będzie Jakub Marchwicki, oto jego streszczenie:
>
> "Lucene - w poszukiwaniu zaginionej informacji"


Dziękuję wszystkim za obecność. Wydaje mi się że wyszło bardzo dobrze,
chociaż kilka z obecnych osób dysponowało daleko szerszą znajomością
Lucene niż moja skromna osoba. Mam nadzieję że pojawi się kiedyś
wykład 'Lucene Advanced Topics' :)

Zgodnie z obietnicą projekt i prezentowane przeze mnie kody źródłowe:
http://groups.google.com/group/jug-trojmiasto/web/jug29042010.zip

Dodatkowa na spotkaniu pojawiły się (in order of appearance):
Luke - http://www.getopt.org/luke/
Narzędzie do debuggowania indeksów Lucene. Ważna uwaga, to cudko nie
współpracuje póki co z Version.LUCENE_30. Z 2.9.x działa bardzo
dobrze.

Solr - http://lucene.apache.org/solr/
Czyli Lucene opakowana w kontener webowy.

Jeszcze raz dzięki. Ja się sporo dowiedziałem - mam nadzieję że komuś
też to się przyda :)

megzi

unread,
Apr 30, 2010, 4:53:14 AM4/30/10
to Trójmiasto JUG
On 29 Kwi, 21:48, "kuba.marchwicki" <kuba.marchwi...@gmail.com> wrote:
> On 22 Kwi, 16:56, Jakub Neumann <kuba.neum...@gmail.com> wrote:
>
> > Serdecznie zapraszamy na kolejne spotkanie Trójmiasto JUG, we czwartek
> > 29.04.2010, godz. 17.30, aula 2, Wydział MFI UG, ul. Wita Stwosza 57,
> > Gdańsk. Wstęp oczywiście jak najbardziej wolny!
>
> > O Lucene opowiadał będzie Jakub Marchwicki, oto jego streszczenie:
>
> > "Lucene - w poszukiwaniu zaginionej informacji"
>
> Dziękuję wszystkim za obecność. Wydaje mi się że wyszło bardzo dobrze,
> chociaż kilka z obecnych osób dysponowało daleko szerszą znajomością
> Lucene niż moja skromna osoba. Mam nadzieję że pojawi się kiedyś
> wykład 'Lucene Advanced Topics' :)
>
> Zgodnie z obietnicą projekt i prezentowane przeze mnie kody źródłowe:http://groups.google.com/group/jug-trojmiasto/web/jug29042010.zip
>
> Dodatkowa na spotkaniu pojawiły się (in order of appearance):
> Luke -http://www.getopt.org/luke/
> Narzędzie do debuggowania indeksów Lucene. Ważna uwaga, to cudko nie
> współpracuje póki co z Version.LUCENE_30. Z 2.9.x działa bardzo
> dobrze.
>

Luke od wersji 1.0.0 obsługuje indeksu lucene w wersji 3.0 tyle, że
autor (pan
Andrzej Białecki) przeniósł stronę projektu na http://code.google.com/p/luke/
od wersji 1.0.0.
(Wersja 1.0.0 niestety ma problem z analizatorami, ale został on
poprawiony 1.0.1)

> Solr -http://lucene.apache.org/solr/
> Czyli Lucene opakowana w kontener webowy.
>
> Jeszcze raz dzięki. Ja się sporo dowiedziałem - mam nadzieję że komuś
> też to się przyda :)
>
> Kuba
>

Moim zdaniem bardzo dobra prezentacja. Trafne przykłady obrazujące
najważniejsze zagadnienia związane z lucene.
Nie do przecenienia są uwagi/wtrącenia związane z doświadczeniem
zarówno pracą z klientem jak i rzeczywistym procesem pozyskiwania
danych do zaindeksowania i sposobem przedstawiania wyników.

Polecam grupę java-...@lucene.apache.org (http://www.gossamer-
threads.com/lists/lucene/java-user/). Są tam odpowiedzi na różne
pytania, od najprostszych dotyczących podstaw składania zapytań po
optymalizację indeksów produkcyjnych (miliony dokumentów, GB danych)

Myślę, że Dominika - dziewczyna, która udzielała odpowiedzi m.in. na
problem wyszukiwania z polskimi znakami diakrytycznymi - z chęcią
podzieli się swoją wiedzą jeśli byłoby zainteresowanie na wykład nieco
bardziej wgłębiający się w bebechy lucene :)
Reply all
Reply to author
Forward
0 new messages