Группировка результатов по сайтам

37 views
Skip to first unread message

Morfei

unread,
Dec 14, 2011, 12:44:29 PM12/14/11
to datapar...@googlegroups.com
Здравствуйте.

Обновился с SVN заметил проблему.

GroupBySite=Yes передается, но при выводе результатов поиска сайты повторяются, а не группируются. Хотя если потом перейти по ссылке на похожие, результаты будут именно с одного сайта.

Maxim Zakharov

unread,
Dec 16, 2011, 7:48:19 AM12/16/11
to datapar...@googlegroups.com
Добрый день,

да, в текущей версии в SVN изменена группировка результатов по сайтам.
Теперь группируются только результаты с одного сайта, идущие подряд.

Во-первых, такой подход позволяет избежать дополнительной сортировки
результатов для полной группировки (как было ранее), т.е. дает более
быстрый поиск.

Во-вторых, дает более полную выдачу, обеспечивая её некоторое
разнообразие по сайтам.


2011/12/15 Morfei <pu...@mail.ru>:

--
http://www.dataparksearch.org/ - an open source search engine.

Morfei

unread,
Dec 18, 2011, 5:37:58 AM12/18/11
to DataparkSearch
А как то в конфиге можно указать, чтоб старый вывод результатов был? А
то выводится 5 страниц и там всего 2 сайта по очереди.

On 16 дек, 21:48, Maxim Zakharov <dp.max...@gmail.com> wrote:
> Добрый день,
>
> да, в текущей версии в SVN изменена группировка результатов по сайтам.
> Теперь группируются только результаты с одного сайта, идущие подряд.
>
> Во-первых, такой подход позволяет избежать дополнительной сортировки
> результатов для полной группировки (как было ранее), т.е. дает более
> быстрый поиск.
>
> Во-вторых, дает более полную выдачу, обеспечивая её некоторое
> разнообразие по сайтам.
>

> 2011/12/15 Morfei <p...@mail.ru>:


>
> > Здравствуйте.
>
> > Обновился с SVN заметил проблему.
>
> > GroupBySite=Yes передается, но при выводе результатов поиска сайты
> > повторяются, а не группируются. Хотя если потом перейти по ссылке на
> > похожие, результаты будут именно с одного сайта.
>

> --http://www.dataparksearch.org/- an open source search engine.

Morfei

unread,
Dec 18, 2011, 4:18:08 PM12/18/11
to DataparkSearch
Большинство вариантов вывода, получается вообще только с одного сайта.
То есть ввоже допустим запрос "Видео" и получаю 5 страниц результатов
с одного единственного сайта, хотя на других валом "Видео".

Maxim Zakharov

unread,
Dec 20, 2011, 7:44:16 AM12/20/11
to datapar...@googlegroups.com
Пока такой возможности нет, нор она появится в ближайшее время.

2011/12/18 Morfei <pu...@mail.ru>:


> А как то в конфиге можно указать, чтоб старый вывод результатов был? А
> то выводится 5 страниц и там всего 2 сайта по очереди.
>

--
http://www.dataparksearch.org/ - an open source search engine.

Maxim Zakharov

unread,
Dec 27, 2011, 9:16:02 AM12/27/11
to datapar...@googlegroups.com
В текущей версии в SVN появилась возможность указать GroupBySite=full
и получить старую (полную) группировку по сайтам.

2011/12/20 Maxim Zakharov <dp.m...@gmail.com>:

Morfei

unread,
Dec 27, 2011, 11:50:41 AM12/27/11
to DataparkSearch
Отета спасибо Максим. Оперативно. И чтоб не создавать еще тему спрошу.
Как вывести результаты с определенного сайта первыми? Раньше
результаты с моего сайта выводились первыми, сейчас на второй, третьей
странице.

On 27 дек, 23:16, Maxim Zakharov <dp.max...@gmail.com> wrote:
> В текущей версии в SVN появилась возможность указать GroupBySite=full
> и получить старую (полную) группировку по сайтам.
>

> 2011/12/20 Maxim Zakharov <dp.max...@gmail.com>:


>
> > Пока такой возможности нет, нор она появится в ближайшее время.
>

> > 2011/12/18 Morfei <p...@mail.ru>:


> >> А как то в конфиге можно указать, чтоб старый вывод результатов был? А
> >> то выводится 5 страниц и там всего 2 сайта по очереди.
>
> > --

> >http://www.dataparksearch.org/- an open source search engine.
>
> --http://www.dataparksearch.org/- an open source search engine.

Morfei

unread,
Dec 27, 2011, 12:15:53 PM12/27/11
to DataparkSearch
Продолжил индексирование и получаю

URL: http://сайт
indexer[5420]: {00} No HTTP response status

Хотя все открываетьси

On 28 дек, 01:50, Morfei <p...@mail.ru> wrote:
> Отета спасибо Максим. Оперативно. И чтоб не создавать еще тему спрошу.
> Как вывести результаты с определенного сайта первыми? Раньше
> результаты с моего сайта выводились первыми, сейчас на второй, третьей
> странице.
>
> On 27 дек, 23:16, Maxim Zakharov <dp.max...@gmail.com> wrote:
>
>
>
>
>
>
>
> > В текущей версии в SVN появилась возможность указать GroupBySite=full
> > и получить старую (полную) группировку по сайтам.
>
> > 2011/12/20 Maxim Zakharov <dp.max...@gmail.com>:
>
> > > Пока такой возможности нет, нор она появится в ближайшее время.
>
> > > 2011/12/18 Morfei <p...@mail.ru>:
> > >> А как то в конфиге можно указать, чтоб старый вывод результатов был? А
> > >> то выводится 5 страниц и там всего 2 сайта по очереди.
>
> > > --

> > >http://www.dataparksearch.org/-an open source search engine.

Morfei

unread,
Dec 27, 2011, 12:55:50 PM12/27/11
to DataparkSearch
Получил

Database statistics

Status Expired Total
-----------------------------
0 0 17859 Not indexed yet
200 0 75167 OK
206 0 7 Partial OK
301 0 908 Moved Permanently
302 0 10913 Moved Temporarily
303 0 2516 See Other
400 0 1 Bad Request
403 0 2007 Forbidden
404 0 328 Not found
415 0 5125 Unsupported Media Type
500 0 17 Internal Server Error
502 0 3 Bad Gateway
503 0 1 Service Unavailable
2200 0 2382 Clones, OK
-----------------------------
Total 0 117234

Morfei

unread,
Dec 27, 2011, 1:31:01 PM12/27/11
to DataparkSearch
Я так понял вернулась проблема

http://groups.google.com/group/dataparksearch/browse_thread/thread/81b4ee3bc10d01f2

Закоментил CrawlDelay и индексация пошла. Предварительно скинул ./
indexer -as0

On 28 дек, 02:55, Morfei <p...@mail.ru> wrote:
> đĎĚŐŢÉĚ


>
>  Database statistics
>
> Status    Expired      Total
>    -----------------------------
>      0          0      17859 Not indexed yet
>    200          0      75167 OK
>    206          0          7 Partial OK
>    301          0        908 Moved Permanently
>    302          0      10913 Moved Temporarily
>    303          0       2516 See Other
>    400          0          1 Bad Request
>    403          0       2007 Forbidden
>    404          0        328 Not found
>    415          0       5125 Unsupported Media Type
>    500          0         17 Internal Server Error
>    502          0          3 Bad Gateway
>    503          0          1 Service Unavailable
>   2200          0       2382 Clones, OK
>    -----------------------------
>  Total          0     117234
>

> On 28 ÄĹË, 02:15, Morfei <p...@mail.ru> wrote:
>
>
>
>
>
>
>
> > đŇĎÄĎĚÖÉĚ ÉÎÄĹËÓÉŇĎ×ÁÎÉĹ É ĐĎĚŐŢÁŔ
>
> > URL: http://ÓÁĘÔ


> > indexer[5420]: {00} No HTTP response status
>

> > čĎÔŃ ×ÓĹ ĎÔËŇŮ×ÁĹÔŘÓÉ
>
> > On 28 ÄĹË, 01:50, Morfei <p...@mail.ru> wrote:
>
> > > ďÔĹÔÁ ÓĐÁÓÉÂĎ íÁËÓÉÍ. ďĐĹŇÁÔÉ×ÎĎ. é ŢÔĎ ÎĹ ÓĎÚÄÁ×ÁÔŘ ĹÝĹ ÔĹÍŐ ÓĐŇĎŰŐ.
> > > ëÁË ×Ů×ĹÓÔÉ ŇĹÚŐĚŘÔÁÔŮ Ó ĎĐŇĹÄĹĚĹÎÎĎÇĎ ÓÁĘÔÁ ĐĹŇ×ŮÍÉ? ňÁÎŘŰĹ
> > > ŇĹÚŐĚŘÔÁÔŮ Ó ÍĎĹÇĎ ÓÁĘÔÁ ×Ů×ĎÄÉĚÉÓŘ ĐĹŇ×ŮÍÉ, ÓĹĘŢÁÓ ÎÁ ×ÔĎŇĎĘ, ÔŇĹÔŘĹĘ
> > > ÓÔŇÁÎÉĂĹ.
>
> > > On 27 ÄĹË, 23:16, Maxim Zakharov <dp.max...@gmail.com> wrote:
>
> > > > ÷ ÔĹËŐÝĹĘ ×ĹŇÓÉÉ × SVN ĐĎŃ×ÉĚÁÓŘ ×ĎÚÍĎÖÎĎÓÔŘ ŐËÁÚÁÔŘ GroupBySite=full
> > > > É ĐĎĚŐŢÉÔŘ ÓÔÁŇŐŔ (ĐĎĚÎŐŔ) ÇŇŐĐĐÉŇĎ×ËŐ ĐĎ ÓÁĘÔÁÍ.
>
> > > > 2011/12/20 Maxim Zakharov <dp.max...@gmail.com>:
>
> > > > > đĎËÁ ÔÁËĎĘ ×ĎÚÍĎÖÎĎÓÔÉ ÎĹÔ, ÎĎŇ ĎÎÁ ĐĎŃ×ÉÔÓŃ × ÂĚÉÖÁĘŰĹĹ ×ŇĹÍŃ.
>
> > > > > 2011/12/18 Morfei <p...@mail.ru>:
> > > > >> á ËÁË ÔĎ × ËĎÎĆÉÇĹ ÍĎÖÎĎ ŐËÁÚÁÔŘ, ŢÔĎ ÓÔÁŇŮĘ ×Ů×ĎÄ ŇĹÚŐĚŘÔÁÔĎ× ÂŮĚ? á
> > > > >> ÔĎ ×Ů×ĎÄÉÔÓŃ 5 ÓÔŇÁÎÉĂ É ÔÁÍ ×ÓĹÇĎ 2 ÓÁĘÔÁ ĐĎ ĎŢĹŇĹÄÉ.


>
> > > > > --
> > > > >http://www.dataparksearch.org/-anopensource search engine.
>

> > > > --http://www.dataparksearch.org/-anopensource search engine.

Reply all
Reply to author
Forward
0 new messages