Если ввести запрос русскими.., то отказывается искать.

37 views
Skip to first unread message

Damian Linson

unread,
Sep 16, 2016, 4:19:03 AM9/16/16
to DataparkSearch Engine
Привет. И снова я. Всё в UTF-8. Проект находится по адресу: www.linson.ru
Если ввести запрос русскими.., то отказывается искать. В остальном же также ищет.. Запущен: cached.
Есть идеи? В чём может быть ошибка или посоветуйте в какую сторону посмотреть?

Maxim Zakharov

unread,
Sep 16, 2016, 5:03:15 AM9/16/16
to DataparkSearch Engine
Привет,

у вас в заголовке страницы результатов стоит такое:
<meta content="charset=">

возможно у вас ошибка в секции top вашего поискового шаблона. Как выглядит соответствующая строка вашего шаблона search.htm?


--
You received this message because you are subscribed to the Google Groups "DataparkSearch Engine" group.
To unsubscribe from this group and stop receiving emails from it, send an email to dataparksearch+unsubscribe@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.



--

Damian Linson

unread,
Sep 16, 2016, 8:05:46 AM9/16/16
to DataparkSearch Engine
Спасибо, что ответили.
Выглядит вот так:
<!--top-->
<!DOCTYPE html>
<html>
<head>
<meta content="charset=$(BrowserCharset)">
<title>Damian Linson Search</title>
<link rel="stylesheet" type="text/css" href="style.css">

Это вся секция top. Пришла одна мысль, что дело в кодировке.. Может он запрашивает какую-нибудь абракадабру вместо русского слова. Поэтому и не находит..
Что маловероятно. Но всё перепроверил. И заголовок, вроде адекватный:
HTTP/1.1 200 OK
Date: Fri, 16 Sep 2016 12:04:47 GMT
Server: Apache
Content-Type: text/html; charset=UTF-8

пятница, 16 сентября 2016 г., 12:03:15 UTC+3 пользователь Maxime написал:
Привет,

у вас в заголовке страницы результатов стоит такое:
<meta content="charset=">

возможно у вас ошибка в секции top вашего поискового шаблона. Как выглядит соответствующая строка вашего шаблона search.htm?

2016-09-16 18:19 GMT+10:00 Damian Linson <dam...@linson.ru>:
Привет. И снова я. Всё в UTF-8. Проект находится по адресу: www.linson.ru
Если ввести запрос русскими.., то отказывается искать. В остальном же также ищет.. Запущен: cached.
Есть идеи? В чём может быть ошибка или посоветуйте в какую сторону посмотреть?

--
You received this message because you are subscribed to the Google Groups "DataparkSearch Engine" group.
To unsubscribe from this group and stop receiving emails from it, send an email to dataparksearc...@googlegroups.com.

For more options, visit https://groups.google.com/d/optout.

Maxim Zakharov

unread,
Sep 16, 2016, 10:55:40 AM9/16/16
to DataparkSearch Engine
У вас ошибка в формате тэга meta, он должен выглядеть так:

<meta http-equiv="Content-Type" content="text/html; charset=$(BrowserCharset)">

Возможно у вас также не выставлено значение BrowserCharset в секции variables поискового шаблона search.htm, а по умолчанию используется кодировка ISO-8859-1.
Для вашего случае значение должно быть UTF-8:

BrowserCharset UTF-8


To unsubscribe from this group and stop receiving emails from it, send an email to dataparksearch+unsubscribe@googlegroups.com.

For more options, visit https://groups.google.com/d/optout.

Damian Linson

unread,
Sep 16, 2016, 12:46:57 PM9/16/16
to DataparkSearch Engine
<meta http-equiv="Content-Type" content="text/html; charset=$(BrowserCharset)"> - сделал. Никаких изменений.
BrowserCharset UTF-8 - прописана в search.htm. Выше рекомендованное не помогает.

по-умолчанию используется кодировка ISO-8859-1.. А можно как-то изменить это значение на UTF-8?
Я смотрел код, пробовал изменить его, но он каждый раз ругается на отсутствие ISO-8859-1.
Со временем, думаю, сделаю это. Всё таки, хочется использовать UTF-8 в своих проектах. Благодарю за ответ.

Maxim Zakharov

unread,
Sep 16, 2016, 7:09:24 PM9/16/16
to DataparkSearch Engine

Я не вижу никаких изменений на странице результатов вашего сайта, тэг meta попрежнему некорректный.
Вы точно правите именно тот шаблон поиска, который используется на сайте?

Кодировка utf-8 устанавливается в конфигурации и это работает, править исходники для этого не нужно.


--

Damian Linson

unread,
Sep 17, 2016, 12:54:05 AM9/17/16
to DataparkSearch Engine
Не знаю, дело конечно в кодировке.. Так как запрос отправляется в одной кодировке, а принимается в другой.
Поиск (как на русском, так и латинице) работал, до пор, пока Apache не перенастроил в UTF-8. Как я понимаю (что логично), - причина не в сервере, а в движке.
Я понимаю о чём вы говорите, но сейчас сервер отдаёт UTF-8, а раньше лишь iso-8859-1. Теперь же, когда перенастроил Apache перестал искать именно русские буквы..

Damian Linson

unread,
Sep 17, 2016, 1:02:38 AM9/17/16
to DataparkSearch Engine
Адекватный заголовок, только без: $(BrowserCharset)
<!DOCTYPE html>
<html>
<head>
<meta charset='UTF-8'>

Maxim Zakharov

unread,
Sep 17, 2016, 5:27:00 AM9/17/16
to DataparkSearch Engine
Пришлите мне на dp.m...@gmail.com ваши файлы конфигурации search.htm и indexer.conf предварительно удалив пароли в них.

--
You received this message because you are subscribed to the Google Groups "DataparkSearch Engine" group.
To unsubscribe from this group and stop receiving emails from it, send an email to dataparksearch+unsubscribe@googlegroups.com.

For more options, visit https://groups.google.com/d/optout.

Damian Linson

unread,
Sep 17, 2016, 8:50:18 AM9/17/16
to DataparkSearch Engine
Хорошо. Отправил.

Maxim Zakharov

unread,
Sep 17, 2016, 10:50:25 AM9/17/16
to DataparkSearch Engine
Вы "потеряли" маркер начала секции variables в вашем поисковом шаблоне search.htm:
<!--variables

Он должен идти до любой команды этой секции, т.е. первой строкой в вашем случае.

В вашем Indexer.conf используется команда LocalCharset со значением UTF-8, задающая кодировку вашей базы, именно такая же команда должна указываться в секции variables вашего поискового шаблона, т.к. по умолчанию используется кодировка ISO-8859-1.

Команда
RemoteCharset UTF-8
не имеет смысла в поисковом шаблоне, она используется в файле конфигурации indexer.conf

Команда
ResultContentType text/xml
в вашем поисковом шаблоне не соответствует действительному типу страницы результатов, который есть text/html (это значение используется по умолчанию)

Мета типа
<meta charset='UTF-8'>
используется браузерами при записи страницы в файл на локальном диске, при передаче по сети эта мета в расчет не принимается. Используйте мету, которую я вам указал выше.


On 17 September 2016 at 22:50, Damian Linson <dam...@linson.ru> wrote:
Хорошо. Отправил.

--
You received this message because you are subscribed to the Google Groups "DataparkSearch Engine" group.
To unsubscribe from this group and stop receiving emails from it, send an email to dataparksearch+unsubscribe@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

Damian Linson

unread,
Sep 17, 2016, 10:29:42 PM9/17/16
to DataparkSearch Engine
Максим, доброго времени суток. Сейчас пишет такое:
Ошибка синтаксического анализа XML: несоответствующий тег. Ожидается: </input>.
Адрес: http://linson.ru/
Строка 49, символ 3:</form>
--^

Как исправлю синтаксис, отпишу. По-моему исправлять придётся весь шаблон.

Maxim Zakharov

unread,
Sep 17, 2016, 10:41:25 PM9/17/16
to DataparkSearch Engine
Это результат того, что вы задали тип содержимого text/xml командой ResultContentType, не соответсвующий фактическому типу содержимого вашего шаблона (text/html).
Я об этом указал выше.

--
You received this message because you are subscribed to the Google Groups "DataparkSearch Engine" group.
To unsubscribe from this group and stop receiving emails from it, send an email to dataparksearch+unsubscribe@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

Damian Linson

unread,
Sep 17, 2016, 11:16:16 PM9/17/16
to DataparkSearch Engine
Максим, сильно благодарен вам :) Желаю крепкого здоровья и долголетия. Спасибо за помощь.

Сложность оказалась в search.htm:
- Необходимо было добавить <!--variables ..здесь настройки.. -->;
- И дописать: LocalCharset UTF-8 в ..здесь настройки.. .

Ура! Заработало! - как сказал бы Кот Матроскин.
Reply all
Reply to author
Forward
0 new messages