Ошибки/опечатки/недоделки русскоязычной версии документации Параметры

12 views
Skip to first unread message

itJunky

unread,
Dec 1, 2011, 6:15:05 AM12/1/11
to DataparkSearch
http://www.dataparksearch.org/dpsearch-perf.ru.html#CHECKINSERTSQL-CMD
"это может вызывать к дополнительной обработке" правильнее будет
"может вызвать дополнительную обработку"

itJunky

unread,
Dec 1, 2011, 6:21:14 AM12/1/11
to DataparkSearch
Чуть ниже такая строка "Запись одновлённых индексов на диск",
разумеется должно быть слово "обновлённых"

itJunky

unread,
Dec 1, 2011, 6:52:05 AM12/1/11
to DataparkSearch
http://www.dataparksearch.org/dpsearch-searchd.ru.html 5.4.2. Запуск
searchd
"Если вы ходите для ускорения поиска загрузить в память" -- хоТите

itJunky

unread,
Dec 1, 2011, 7:13:21 AM12/1/11
to DataparkSearch
http://www.dataparksearch.org/dpsearch-subsections.ru.html
"Основная задача тэгов заглючается" -- конечно же "заКлючается"

itJunky

unread,
Dec 1, 2011, 8:00:30 AM12/1/11
to DataparkSearch
http://www.dataparksearch.org/dpsearch-subsections.ru.html

То что описано вроде понятно, но некоторой инфы там просто нет =(
Например непонятно как создавать тэги, тупо изменением записи в Бд?
Тогда надо хотябы одно предложение об этом написать. Так же не ясно
как скоро вступят в действие изменения в базе. Нужно ли что-то
переиндексировать и с какими параметрами. В общем в документации
имеется только половина необходимой для работы информации.

itJunky

unread,
Dec 1, 2011, 8:20:15 AM12/1/11
to DataparkSearch
Вот, например добавил тэг в базу для одного из сайтов, к строке
запроса добавляю &t=izet, но выдача совершенно не изменяется. Но ведь
я сделал всё что было в документации...

itJunky

unread,
Dec 8, 2011, 2:40:38 AM12/8/11
to DataparkSearch
Максим, подскажите, плз. Чего нехватает для работоспособности тэгов?
Есть ли ограничение по содержимому тэгов? Там обязательно должны быть
цифры от 0 до 9 и это должна быть одна цифра или там могут быть ещё и
буквы и даже целые слова неограниченного количества символов?

Maxim Zakharov

unread,
Dec 8, 2011, 6:14:59 AM12/8/11
to datapar...@googlegroups.com
Тэг - последовательность символов, букв, цифр, всего, что можно
записать в поле server.tag.

Тэги должны быть рассмтавлены в indexer.conf до начала индексирования.
Если расстановка тэгов меняется после начала индексирования, чтобы
измнемения вступили в силу нужно переиндексировать все URL, которых
затронуло изменение расстановки тэгов.

При использовании тэгов при поиске, необходимо указать команду Limit в
search.htm (или searchd.conf, если используется searchd):
Limit t:tag

http://www.dataparksearch.org/devel-doc/dpsearch-cachemode.ru.html#LIMITS

Запись тэгов в базу cached происходит при выполнении команды "indexer
-TW". Только по окончании выполнения этой команды (при использовании
cached, он выполняет работу, а указанная выше команда завершаятся
после отправки cached указания на записть лимитов), измнения
расстановки тэгов будут видны в поиске.


2011/12/8 itJunky <alpha...@gmail.com>:

--
http://www.dataparksearch.org/ - an open source search engine.

itJunky

unread,
Dec 9, 2011, 1:38:56 AM12/9/11
to DataparkSearch
Спасибо. Мне кажется, что многое из этого сообщения стоило бы внести в
документацию.

В поле server.tag на один сайт я вбил тэг izet.
После этого добавил Limit t:tag в searchd.conf и перезапустил searchd
Затем обнулил next_index_time у всех уролов по домену который
протэгировал в базе и запустил индексер, который довольно быстро
обошёл 3 тысячи урлов по этому сайту.
При поиске по прежнему выводятся все сайты, если добавлять к строке
запроса &t=izet =(
Что я сделал не так?

Maxim Zakharov

unread,
Dec 11, 2011, 1:51:49 AM12/11/11
to datapar...@googlegroups.com
Тэг нужно добавлять в indexer.conf, иначе он будет удален при запуске
indexer, что у вас скорее всего и произошло.
Также вы не указали запуск команды "indexer -TW", - она необходима,
если используется dbmode cache (по-умолчанию).

2011/12/9 itJunky <alpha...@gmail.com>:

--

itJunky

unread,
Dec 12, 2011, 2:43:35 AM12/12/11
to DataparkSearch
Тэг внесён в indexer.conf таким образом:

find htdocs # grep sites.txt /www/find.zet/dpsearch/etc/indexer.conf
Include /www/find.zet/dpsearch/etc/sites.txt

find htdocs # cat /www/find.zet/dpsearch/etc/sites.txt
...
Category 0101
Tag izet
Server http://www.intt.ru/
Disallow regex ^http://www.intt.ru/.*(programma-descr.html|
request.html|programma.html).*

Category 0102
Tag f_izet
Realm http://forum.interzet.ru/lofiversion/*.html
Server hrefonly http://forum.intt.ru/
Disallow regex ^http://forum.intt.ru/.*(threaded|Search|Login|calendar|
Help|rep|Reg|prune_day|mode=linear|&p=|attach).*
Disallow regex ^http://forum.intt.ru/.*(Members|showuser|CODE|Forward|
viewtopic|linearplus|findpost|client=printer|view=old|view=findpost).*
Tag ""
Category

DeleteOlder 0
...

Индексер запускается по крону с ключами:
30 */3 * * * /www/find.zet/dpsearch/sbin/
indexer -drW -N 2 -n 5000 > /dev/null 2>&1

Тоесть ключик -W send to cached command to write url data
and to create limits имеет место быть.

itJunky

unread,
Dec 12, 2011, 8:01:26 AM12/12/11
to DataparkSearch
Ого, чего это глупый гуглогруп кодировку то засрал?
Надеюсь суть сообщения ясна, а если нет, то поможет charset.ru

itJunky

unread,
Dec 16, 2011, 7:21:34 AM12/16/11
to DataparkSearch
Максим, подскажите пожалуйста, что же мне делать?
Если не понятен пост из-за кодировки, постараюсь ещё раз
сформулировать.

Maxim Zakharov

unread,
Dec 16, 2011, 8:34:52 AM12/16/11
to datapar...@googlegroups.com
Добрый день,

возможно вам следует установить
MaxSiteLevel 3

Эта команда устанавливает максимальный уровень доменного имени,
используемого при вычислении идентификатора сайта (по которому
осуществляется группировка).
Значение по умолчанию - 2, а у вас к разным тэгам отнесены сайты
www.intt.ru и forum.intt.ru и при значении по-умолчанию они будут
иметь одинаковый идентификатор сайта.

см. http://www.dataparksearch.org/devel-doc/dpsearch-templates.ru.html#TEMPLATES-VAR

При изменении значения MaxSiteLevel необходимо произвести полное
переиндексирование.

2011/12/16 itJunky <alpha...@gmail.com>:


> Максим, подскажите пожалуйста, что же мне делать?
> Если не понятен пост из-за кодировки, постараюсь ещё раз
> сформулировать.

--

itJunky

unread,
Dec 19, 2011, 3:07:27 AM12/19/11
to DataparkSearch
> MaxSiteLevel 3
Эта директива уже давно имеет значение 3. Кроме того проблема же не в
том что я нажимаю по "всем сыылкам с этого сайта". Там, какраз всё уже
нормально и эти два сайта выглядят как отдельные.

itJunky

unread,
Dec 19, 2011, 3:08:41 AM12/19/11
to DataparkSearch
Дело именно в том, что тэги не работают впринципе. Как-будто я где-то
их не включил. Хотя по документации и данным выше советам всё включено.

Maxime

unread,
Dec 20, 2011, 6:39:15 AM12/20/11
to DataparkSearch
используется ли вами команды SrvInfoSQL и URLInfoSQL, и если да, то
какое значение указано при них, yes или no?

itJunky

unread,
Dec 21, 2011, 7:29:55 AM12/21/11
to DataparkSearch
find ~ # grep SrvInfoSQL /www/dpsearch/etc/*find ~ # grep URLInfoSQL /
www/dpsearch/etc/*dpsearch/etc/indexer.conf:URLInfoSQL no

itJunky

unread,
Dec 22, 2011, 3:35:00 AM12/22/11
to DataparkSearch
Максим, в документации до сих пор не исправлены ошибки, которые я
описывал в начале темы. Кроме того найдено ещё несколько:
http://www.dataparksearch.org/dpsearch-subsections.ru.html#TAGS
"Основная задача тэгов заглючается в" -- конечно заКлючается.

http://www.dataparksearch.org/dpsearch-categories.ru.html
"Категории похожи на тэги, но обладают свойство вложенности." --
свойствоМ

itJunky

unread,
Dec 22, 2011, 3:46:17 AM12/22/11
to DataparkSearch
http://www.dataparksearch.org/dpsearch-html.ru.html
"Блок <!--variables--> только используется search.cgi Остальные блоки
формируют" -- поменять местами слова "чиспользуется только" и добавить
точку после search.cgi, врядли она смутит кого-то из читающих эту
документацию =)

"как верх и низ страницы результатов соответственно.

также существуют следующие блоки <!--restop-->, <!--res--> and <!--
resbot--> " Зачем-то <br> лишний и "Так же" слитно и с маленькой
буквы. А в конце "and" заменить на "и".

itJunky

unread,
Dec 22, 2011, 3:58:30 AM12/22/11
to DataparkSearch
http://www.dataparksearch.org/dpsearch-html.ru.html
Стоит прочитать эту страницу целиком, там ошибки почти в каждой
строке. Но я приведу логическую: "Отдельные блоки могут быть
отформатированы так угодно, насколько их форматирование закончено в
пределах этого блока."
Абсолютно непонятное предложение. Я бы написал так: "Отдельные блоки
могут быть отформатированы так чтобы их форматирование было закончено
в пределах этого блока"

Maxim Zakharov

unread,
Dec 22, 2011, 5:05:46 AM12/22/11
to datapar...@googlegroups.com
Спасибо,
я внес корректировки по замеченным вами ошибкам в документации.
Изменения доступны в SVN-репозитории.

2011/12/22 itJunky <alpha...@gmail.com>:

--

Reply all
Reply to author
Forward
0 new messages