Что
конкретно не так с поиском?
■
На первом месте у компаний не хороший
поиск, а деньги
Современные
поисковые системы столкнулись с фундаментальным
конфликтом интересов. Google получает основную прибыль
от рекламы, поэтому он хочет удерживать
пользователей внутри собственной экосистемы,
а не отправлять их на внешние сайты.
Это приводит к тому, что порой, когда
вы видите страницу с выдачей поисковика,
до 90% экрана могут
занимать не сами органические (то есть
сформированные поисковыми алгоритмами) результаты,
а нечто другое. Например, спонсорские ссылки,
рекламные карточки товаров, блоки «Вопросы
по теме», «Другие также ищут»
и сгенерированные ИИ ответы
(AI Overview).
В русскоязычном
интернете ситуация не лучше. После укрепления
позиций «Яндекса» на российском рынке поиска
до 68–74% компаний активно продвигают собственные
сервисы через поисковую выдачу. Запрос о ресторанах
приводит к «Яндекс.Еде», поиск товаров —
к «Маркету», вопросы — к ответам
из «Кью». Основательных исследований
по органическим результатам в «Яндексе» нет,
но, по моим наблюдениям, ситуация схожа
с Google. Только она еще ухудшается цензурными ограничениями «Яндекса».
■
Поиск засорен спамом
Исследование
научно-исследовательской группы Webis Group,
проведенное в 2024 году более чем на 7 тысячах
запросах, связанных с обзорами продуктов,
в Google, Bing и DuckDuckGo, выявило системное
засорение спамом. По запросам типа «лучший телефон
2024» первые позиции занимают не экспертные обзоры,
а специально оптимизированные под поиск страницы
с рекламными ссылками на Amazon.
Более
того: исследователи обнаружили обратную корреляцию между
уровнем оптимизации страницы
и ее экспертностью, то есть чем лучше
страница настроена под алгоритмы, тем меньше на ней
полезной информации.
В этом же
исследовании авторы отмечают проблему сгенерированного
контента. Речь об AI-фермах — сайтах, массово
генерирующих тексты с помощью нейросетей. Да,
Google старается исключать их из поиска,
однако на место удаленных ресурсов тут же
приходят новые. Причем они используют более изощренные
методы маскировки и автоматические методы
оптимизации.
↘︎
Как мусорные ИИ-посты заполняют интернет, почему треть
ссылок, которые существовали в сети еще 10 лет
назад, больше недоступны — и можно ли
со всем этим что-то сделать? Читайте
в этом письме Kit
■
Люди перестали ходить по ссылкам
Самое
драматичное изменение поисковиков последних лет —
это рост так называемых нулевых кликов — поисков,
которые не приводят к переходам
на внешние сайты. По данным исследования
специализирующейся на маркетинговых исследованиях
американской компании SparkToro
за 2024 год, 58,5% поисков в США и 59,7%
в ЕС заканчиваются без единого клика.
Пользователи получают ответ прямо в выдаче через
AI Overview, сниппеты или интегрированные
калькуляторы.
Проблема
не только в потере трафика сайтами,
но и в удобстве: пользователю,
в отличие от владельца сайта, наплевать, где
он получил информацию. В результате
пользователь, получивший «быстрый ответ», перестает
проверять источники и сопоставлять разные точки
зрения. У него появляется иллюзия абсолютного
знания, которое выдает ему поисковик. Хотя на самом
деле zero-click результаты часто лишены контекста
и могут содержать критические ошибки,
в особенности с введением функций
ИИ-ответов.
■
Поисковики стали показывать меньше ссылок
С 2024
года Google ограничил максимальное количество
результатов на запрос до 300–400 позиций
(а раньше их были десятки тысяч). Это
означает, что, если по вашей теме существуют тысячи
релевантных страниц, вы увидите лишь небольшую
выборку, сформированную алгоритмами
по не очень прозрачным критериям.
И далеко не факт, что результат, который нужен
вам, вообще появится в выдаче, не говоря уже
о топ-10 результатов.
■
ИИ постоянно галлюцинирует и подменяет
собой правду
Как
вы наверняка знаете, языковые модели работают
по принципу предсказания следующего слова
в последовательности на основе статистики.
У них нет представления об истинности или
ложности утверждений, их задача — создать
правдоподобно звучащий текст. Когда Google встраивает
Gemini в поисковую выдачу через AI Overview,
любая неточность в данных или сбой в работе
системы приводит к очень уверенно сформулированным,
но фактически неверным ответам. Даже если
материалы, на которых основан ИИ-ответ, содержат
однозначный вывод, ответ все равно может вводить
в заблуждение или попросту быть ложным.
Исследования
показывают, что частота галлюцинаций в современных
ИИ может порой подниматься до 79%, а при
работе с новостной повесткой и вовсе до 91%.
В 2024-м
AI Overview от Google стал объектом массовых
насмешек из-за абсурдных рекомендаций. Система
советовала добавлять клей в пиццу для лучшего
прилипания сыра, есть камни, чтобы получить минералы,
и использовать ножницы для кардиотренировок.
Источником этих «советов» оказались старые ироничные
посты с Reddit, которые ИИ воспринял
всерьез.
Проблемы
возникают и в критически важных сферах.
Исследователи из Стэнфорда обнаружили,
что специализированные юридические ИИ-инструменты,
которыми пользуются западные юристы и судьи, выдают
неверную информацию как минимум в каждом шестом
запросе.
Само
собой, Google реагирует: компания внедрила
более строгие фильтры для AI Overview, ограничив
использование юмористического и пользовательского
контента. «Яндекс» обучил
Yandex GPT распознавать собственные галлюцинации, что
позволило, если верить компании, сократить
их количество в шесть раз.
Однако
разработчики признают: полностью устранить галлюцинации
в текущих архитектурах невозможно.
Проблема
усугубляется тем, что пользователи, судя по всему,
доверяют
ИИ-ответам больше, чем обычным поисковым результатам.
Красиво оформленный блок с «авторитетным» ответом
создает иллюзию надежности, хотя фактически может
содержать грубые ошибки.
Так
как теперь искать информацию в интернете?
→
Пользуйтесь расширенным поиском и его
операторами
Расширенный
поиск остается надежным и куда более непредвзятым
инструментом, чем обычный поиск. Зайти в него можно
через «Настройки» в нижнем правом углу главной
страницы поиска или по прямой
ссылке.
Здесь
вы можете выбрать собственные фильтры, в том
числе:
— точный
поиск по словосочетанию или фразе
— поиск
с альтернативой (или то, или другое)
— на определенном
языке
— фильтр
результатов по стране, домену или дате
обновления
— поиск
по файлам
Расширенный
поиск основан на так называемых операторах
расширенного поиска — то есть коротких
текстовых командах, которых у Google существует
несколько десятков. Кстати, их задача, вопреки
названию, не расширить поиск, а, наоборот, сузить
и сделать более точным. Эти операторы можно
использовать и в обычном режиме поиска,
не переходя в расширенный. Некоторые команды
работают и в «Яндексе».
Например,
чтобы найти точную фразу или конкретное слово
в интернете, без каких-либо изменений,
их нужно взять в кавычки. Если же
вы хотите, чтобы это слово содержалось
не в заголовке или названии страницы,
а именно в ее теле, используйте команду
Intext. Например: Intext:«Шойгу С. К.».
Чтобы
искать на конкретном сайте, используйте вместе
с искомым словом команду site: для Google
и host: или url: для «Яндекса». А для поиска
документов воспользуйтесь командой filetype: (Google)
и mime: («Яндекс»). Например, запрос «„коэффициент
материнской смертности“ site:rosstat.gov.ru filetype:xls» поможет
найти Excel-таблицы с официальной статистикой
материнской смертности на сайте Росстата.
А запрос «site:kremlin.ru filetype:pdf лужков»
позволит найти единственный доступный на сайте
Кремля документ с упоминанием второго мэра
Москвы.
Правильное
использование операторов поиска позволит вам сократить
выдачу до нескольких десятков (а иногда
и вообще до нескольких) релевантных
результатов. И не забывайте, что следует
использовать кавычки-лапки («»), а не ёлочки
(«»). Кроме того, между оператором и поисковым
запросом не должно быть пробелов.
→
Используйте программируемые поисковые
системы
Google
Custom Search Engines (CSE) — это недооцененная
технология 2008 года, которая в 2025-м становится
жизненно необходимой. CSE позволяет создать собственную
поисковую машину, работающую только по выбранным
источниками информации и исключающую рекламный
мусор.
Основные
преимущества CSE — это обход лимита в 300
результатов, то есть CSE может показывать все
релевантные страницы; отсутствие спама
и ИИ-ответов — вы сами выбираете
источники, что сужает спектр поиска и делает его
эффективнее. И, конечно, отсутствие рекламы, благодаря
чему ваша выдача будет максимально чистой.
Вот
несколько готовых CSE, которые создал я и мои
коллеги:
Многие
из этих примеров имеют довольно узкую специализацию
и вряд ли вам пригодятся, однако есть
множество других CSE. Вы можете посмотреть
их по этой ссылке.
Или же
создать собственную поисковую систему, что занимает
15–20 минут и может кардинально улучшить качество
исследований. Например, CSE, настроенный
на качественные научные журналы, исключит все
непроверенные издания и псевдонаучные сайты.
Видеоинструкция по настройке собственного движка
находится здесь.
↘︎
Как с помощью технологий и открытых данных
любой человек может следить за ходом боевых
действий, фиксировать и даже расследовать военные
преступления? Письмо
об OSINT
→
Спрашивайте ИИ (но с умом)
Несмотря
на все недостатки ИИ, нейросети все же можно
использовать для качественного поиска в интернете.
Главное правило здесь простое — проверять
первоисточники. По моему опыту лучше других
ИИ (и с меньшим количеством галлюцинаций)
ищет информацию Perplexity — платформа, которая
изначально создавалась для поиска
в интернете.
В отличие
от классических поисковиков, Perplexity использует
собственную модель Sonar и другие языковые модели
(ChatGPT, Claude, Grok) для анализа информации
и формирует ответы не только на основе
загруженной базы данных, но и с учетом
актуальных данных из интернета.
А новые
функции 2025 года позволяют в разы сократить
время на глубокий поиск. Так, на подробнейший
анализ личных и финансовых связей северокорейского
лидера Ким Чен Ына уйдет не больше 10
минут.
Другой
полезный инструмент — это Search Whisperer. Его
разработал гуру расследований по открытым данным
Хенк ван Эсс. Search Whisperer помогает вам
сформулировать максимально нейтральный
и эффективный поисковый запрос, чтобы
вы получили лучшую выдачу, когда будете искать
в гугле или «Яндексе».
Объясню
на примере, зачем это нужно. Почти любая
формулировка запроса содержит скрытые предположения.
Мы сами часто формируем собственные заблуждения.
Запрос «почему вакцины опасны?» даст совершенно иные
результаты, чем «безопасность вакцин исследования».
Интерфейс
Search Whisperer прост, а в методичке
«Проверено» есть инструкция
на русском по его использованию.
Другой
созданный Хенком ван Эссом инструмент, AI Research
Pilot, позволяет выбрать направление исследования
и получить готовый текстовый промпт (то есть
команду) для других ИИ, в том числе —
Perplexity, ChatGPT, Mistral. Собственно, этот промпт
и поможет вам получить нужные данные. Инструмент
предназначен для журналистов, исследователей,
расследователей и аналитиков. Как
и у Search Whisperer, интерфейс сервиса
англоязычный, но запросы можно отправлять
на любых языках. Подробнее о том, как работать
с AI Research Pilot, я рассказываю
в этом бесплатном
вебинаре.
→
Боритесь с географическими ограничениями
Поисковые
системы все активнее персонализируют выдачу
по вашему местоположению. По одному
и тому же запросу пользователи из разных
стран, скорее всего, получат совершенно разные
результаты. Возможно — с противоречащими друг
другу ссылками. Влияет на результат
и устройство, с которого вы ищете
информацию.
Так,
по запросу «какую книгу в мире воруют чаще
всего?» пользователь Android из Казахстана
«узнает», что это книга Адитьи Бхаргавы «Грокаем
алгоритмы», а пользователю ПК из России
Google расскажет, что это Библия. Оба ответа при этом неверны.
Более
того: в 2025 году Google официально перейдет
на единый домен google.com для всех стран.
Поддержка же национальных доменов (таких как google.ru, google.fr, google.de)
прекратится. В результате роль алгоритмов только
возрастет, и теперь вы не сможете зайти
на Goodle другой страны, чтобы сравнить
результаты.
Чтобы
изменить это, используйте VPN, а также сервисы типа
I Search
From и Impersonal.me. А при работе
с ИИ меняйте язык ввода или уточняйте, что вам
нужны результаты из конкретной страны: например,
только из США или только из Казахстана.
→
Наконец, еще несколько важных базовых правил
поиска
- Используйте
«принцип трех» — всегда искать подтверждение
из трех независимых источников.
- Сознательно
ищите опровержения первоначальным находкам.
И только после ознакомления с ними делайте
выводы.
- Не принимайте
решения на основе единственного поиска или одной
поисковой машины. Воспользуйтесь альтернативами:
DuckDuckGo, Brave, Bing. У них другие алгоритмы
поиска, поэтому вы можете получить иные
результаты. А в случае с DuckDuckGo
и Brave ваша выдача не будет зависеть
от вашего поведения: эти движки не собирают
ваши личные данные и не формируют результаты
на их основе.
- Формулируйте
запрос в нейтральных терминах.
- Регулярно
чистите cookies и историю поиска (в идеале
надо настроить очистку после каждой сессии), чтобы
ваши прошлые запросы не влияли на новые.
- Используйте
режим инкогнито для «холодного» поиска (ваши данные
не сохраняются в этом режиме).
- Отключите
персонализацию поиска. Это можно сделать в настройках
поиска, если вы залогинены в Google.
><{{{.______)
Деградация
поисковых систем — это не временная проблема,
которая решится обновлением алгоритмов. Это структурный
конфликт между коммерческими интересами платформ
и потребностями пользователей в достоверной
информации. Google и «Яндекс» давно стали
рекламными платформами, которые попутно предоставляют
поисковые услуги, а не наоборот, как было
раньше.
В новой
реальности информационного хаоса выживут те, кто освоит
альтернативные инструменты и методы поиска.
В первую очередь это касается тех, кто работает
с информацией профессионально: журналистов,
исследователей, аналитиков. Им необходимо
инвестировать время в изучение этих инструментов
прямо сейчас. Это не просто конкурентное
преимущество, это базовая грамотность, необходимая для
любой работы с данными.
Правда
все еще существует. Но теперь ее нужно
не просто найти — ее нужно
завоевать.