То что описано вроде понятно, но некоторой инфы там просто нет =(
Например непонятно как создавать тэги, тупо изменением записи в Бд?
Тогда надо хотябы одно предложение об этом написать. Так же не ясно
как скоро вступят в действие изменения в базе. Нужно ли что-то
переиндексировать и с какими параметрами. В общем в документации
имеется только половина необходимой для работы информации.
Тэги должны быть рассмтавлены в indexer.conf до начала индексирования.
Если расстановка тэгов меняется после начала индексирования, чтобы
измнемения вступили в силу нужно переиндексировать все URL, которых
затронуло изменение расстановки тэгов.
При использовании тэгов при поиске, необходимо указать команду Limit в
search.htm (или searchd.conf, если используется searchd):
Limit t:tag
http://www.dataparksearch.org/devel-doc/dpsearch-cachemode.ru.html#LIMITS
Запись тэгов в базу cached происходит при выполнении команды "indexer
-TW". Только по окончании выполнения этой команды (при использовании
cached, он выполняет работу, а указанная выше команда завершаятся
после отправки cached указания на записть лимитов), измнения
расстановки тэгов будут видны в поиске.
2011/12/8 itJunky <alpha...@gmail.com>:
--
http://www.dataparksearch.org/ - an open source search engine.
В поле server.tag на один сайт я вбил тэг izet.
После этого добавил Limit t:tag в searchd.conf и перезапустил searchd
Затем обнулил next_index_time у всех уролов по домену который
протэгировал в базе и запустил индексер, который довольно быстро
обошёл 3 тысячи урлов по этому сайту.
При поиске по прежнему выводятся все сайты, если добавлять к строке
запроса &t=izet =(
Что я сделал не так?
2011/12/9 itJunky <alpha...@gmail.com>:
--
find htdocs # grep sites.txt /www/find.zet/dpsearch/etc/indexer.conf
Include /www/find.zet/dpsearch/etc/sites.txt
find htdocs # cat /www/find.zet/dpsearch/etc/sites.txt
...
Category 0101
Tag izet
Server http://www.intt.ru/
Disallow regex ^http://www.intt.ru/.*(programma-descr.html|
request.html|programma.html).*
Category 0102
Tag f_izet
Realm http://forum.interzet.ru/lofiversion/*.html
Server hrefonly http://forum.intt.ru/
Disallow regex ^http://forum.intt.ru/.*(threaded|Search|Login|calendar|
Help|rep|Reg|prune_day|mode=linear|&p=|attach).*
Disallow regex ^http://forum.intt.ru/.*(Members|showuser|CODE|Forward|
viewtopic|linearplus|findpost|client=printer|view=old|view=findpost).*
Tag ""
Category
DeleteOlder 0
...
Индексер запускается по крону с ключами:
30 */3 * * * /www/find.zet/dpsearch/sbin/
indexer -drW -N 2 -n 5000 > /dev/null 2>&1
Тоесть ключик -W send to cached command to write url data
and to create limits имеет место быть.
возможно вам следует установить
MaxSiteLevel 3
Эта команда устанавливает максимальный уровень доменного имени,
используемого при вычислении идентификатора сайта (по которому
осуществляется группировка).
Значение по умолчанию - 2, а у вас к разным тэгам отнесены сайты
www.intt.ru и forum.intt.ru и при значении по-умолчанию они будут
иметь одинаковый идентификатор сайта.
см. http://www.dataparksearch.org/devel-doc/dpsearch-templates.ru.html#TEMPLATES-VAR
При изменении значения MaxSiteLevel необходимо произвести полное
переиндексирование.
2011/12/16 itJunky <alpha...@gmail.com>:
> Максим, подскажите пожалуйста, что же мне делать?
> Если не понятен пост из-за кодировки, постараюсь ещё раз
> сформулировать.
--
http://www.dataparksearch.org/dpsearch-categories.ru.html
"Категории похожи на тэги, но обладают свойство вложенности." --
свойствоМ
"как верх и низ страницы результатов соответственно.
также существуют следующие блоки <!--restop-->, <!--res--> and <!--
resbot--> " Зачем-то <br> лишний и "Так же" слитно и с маленькой
буквы. А в конце "and" заменить на "и".
2011/12/22 itJunky <alpha...@gmail.com>:
--