*[Enwl] ➜ Поиск в интернете сломался. Что делать?

13 views
Skip to first unread message

ecology

unread,
Jul 31, 2025, 3:20:19 PMJul 31
to "ENWL-uni"
 
( •̀⤙•́ )

Привет, это Павел «Погода» Банников, фактчекер, специалист по OSINT и редактор раздела «Методичка» проекта «Проверено»

Я давно профессионально ищу информацию в интернете, и в 2025 году стало окончательно ясно, что вокруг — кризис поисковых систем. То, что еще пять-шесть лет назад работало практически безотказно — четкий запрос в Google или «Яндекс» с получением релевантных результатов, — превратилось в лотерею. 

Современные поисковые гиганты все чаще выдают рекламу вместо информации, генерируют ИИ-галлюцинации вместо фактов и ограничивают доступ к полному массиву данных. В то же время сами пользователи почти что слепо доверяют искусственному интеллекту и его коротким выжимкам, как будто это абсолютная истина. Более того: люди верят даже ответам чат-ботов, которые вовсе не предназначены для поиска информации. Наверняка вы видели, как пользователи в соцсетях спорят друг с другом переписками с ChatGPT или спрашивают Grok в соцсети X, о вещах, которые он в принципе не может знать.

Показателен пример с поиском по фразе «моральное предпринимательство». Вот что ответит нам встроенный ИИ от Google: «Моральное предпринимательство — это такой подход к бизнесу, когда ведение дел осуществляется с учетом высоких моральных принципов и норм, выходящих за рамки простой прибыли. Это означает, что компания не только стремится к финансовому успеху, но и заботится о благе общества, сотрудников, клиентов и окружающей среды». 

Звучит убедительно, не правда ли? Вот только все это неправда. На самом деле «моральное предпринимательство» не имеет никакого отношения к социально ответственному бизнесу. Это очень конкретный социологический термин, который используют либо для описания акторов так называемой моральной паники (например, конспирологов), либо для объяснения того, как меняются представления о морали в обществе. 

Однако проблемы поисковиков не ограничиваются только выдумывающим факты ИИ — на деле все гораздо хуже. В этом письме я расскажу о главных проблемах Google и «Яндекса», а также объясню, как адаптироваться к новой реальности и научиться эффективно искать информацию в интернете.

■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎

Подпишитесь на рассылку Kit, если вы еще этого не сделали. Мы будем присылать вам одно письмо в месяц. А также подписывайтесь на наш телеграм-канал, там мы публикуем небольшие истории о сломанном мире и о том, как его чинить.

Что конкретно не так с поиском?

На первом месте у компаний не хороший поиск, а деньги 

Современные поисковые системы столкнулись с фундаментальным конфликтом интересов. Google получает основную прибыль от рекламы, поэтому он хочет удерживать пользователей внутри собственной экосистемы, а не отправлять их на внешние сайты. Это приводит к тому, что порой, когда вы видите страницу с выдачей поисковика, до 90% экрана могут занимать не сами органические (то есть сформированные поисковыми алгоритмами) результаты, а нечто другое. Например, спонсорские ссылки, рекламные карточки товаров, блоки «Вопросы по теме», «Другие также ищут» и сгенерированные ИИ ответы (AI Overview).

В русскоязычном интернете ситуация не лучше. После укрепления позиций «Яндекса» на российском рынке поиска до 68–74% компаний активно продвигают собственные сервисы через поисковую выдачу. Запрос о ресторанах приводит к «Яндекс.Еде», поиск товаров — к «Маркету», вопросы — к ответам из «Кью». Основательных исследований по органическим результатам в «Яндексе» нет, но, по моим наблюдениям, ситуация схожа с Google. Только она еще ухудшается цензурными ограничениями «Яндекса».

Поиск засорен спамом

Исследование научно-исследовательской группы Webis Group, проведенное в 2024 году более чем на 7 тысячах запросах, связанных с обзорами продуктов, в Google, Bing и DuckDuckGo, выявило системное засорение спамом. По запросам типа «лучший телефон 2024» первые позиции занимают не экспертные обзоры, а специально оптимизированные под поиск страницы с рекламными ссылками на Amazon. 

Более того: исследователи обнаружили обратную корреляцию между уровнем оптимизации страницы и ее экспертностью, то есть чем лучше страница настроена под алгоритмы, тем меньше на ней полезной информации.

В этом же исследовании авторы отмечают проблему сгенерированного контента. Речь об AI-фермах — сайтах, массово генерирующих тексты с помощью нейросетей. Да, Google старается исключать их из поиска, однако на место удаленных ресурсов тут же приходят новые. Причем они используют более изощренные методы маскировки и автоматические методы оптимизации. 

↘︎ Как мусорные ИИ-посты заполняют интернет, почему треть ссылок, которые существовали в сети еще 10 лет назад, больше недоступны — и можно ли со всем этим что-то сделать? Читайте в этом письме Kit 

Люди перестали ходить по ссылкам

Самое драматичное изменение поисковиков последних лет — это рост так называемых нулевых кликов — поисков, которые не приводят к переходам на внешние сайты. По данным исследования специализирующейся на маркетинговых исследованиях американской компании SparkToro за 2024 год, 58,5% поисков в США и 59,7% в ЕС заканчиваются без единого клика. Пользователи получают ответ прямо в выдаче через AI Overview, сниппеты или интегрированные калькуляторы.

Проблема не только в потере трафика сайтами, но и в удобстве: пользователю, в отличие от владельца сайта, наплевать, где он получил информацию. В результате пользователь, получивший «быстрый ответ», перестает проверять источники и сопоставлять разные точки зрения. У него появляется иллюзия абсолютного знания, которое выдает ему поисковик. Хотя на самом деле zero-click результаты часто лишены контекста и могут содержать критические ошибки, в особенности с введением функций ИИ-ответов. 

Поисковики стали показывать меньше ссылок

С 2024 года Google ограничил максимальное количество результатов на запрос до 300–400 позиций (а раньше их были десятки тысяч). Это означает, что, если по вашей теме существуют тысячи релевантных страниц, вы увидите лишь небольшую выборку, сформированную алгоритмами по не очень прозрачным критериям. И далеко не факт, что результат, который нужен вам, вообще появится в выдаче, не говоря уже о топ-10 результатов. 

ИИ постоянно галлюцинирует и подменяет собой правду

Как вы наверняка знаете, языковые модели работают по принципу предсказания следующего слова в последовательности на основе статистики. У них нет представления об истинности или ложности утверждений, их задача — создать правдоподобно звучащий текст. Когда Google встраивает Gemini в поисковую выдачу через AI Overview, любая неточность в данных или сбой в работе системы приводит к очень уверенно сформулированным, но фактически неверным ответам. Даже если материалы, на которых основан ИИ-ответ, содержат однозначный вывод, ответ все равно может вводить в заблуждение или попросту быть ложным.

Исследования показывают, что частота галлюцинаций в современных ИИ может порой подниматься до 79%, а при работе с новостной повесткой и вовсе до 91%

В 2024-м AI Overview от Google стал объектом массовых насмешек из-за абсурдных рекомендаций. Система советовала добавлять клей в пиццу для лучшего прилипания сыра, есть камни, чтобы получить минералы, и использовать ножницы для кардиотренировок. Источником этих «советов» оказались старые ироничные посты с Reddit, которые ИИ воспринял всерьез.

Проблемы возникают и в критически важных сферах. Исследователи из Стэнфорда обнаружили, что специализированные юридические ИИ-инструменты, которыми пользуются западные юристы и судьи, выдают неверную информацию как минимум в каждом шестом запросе. 

Само собой, Google реагирует: компания внедрила более строгие фильтры для AI Overview, ограничив использование юмористического и пользовательского контента. «Яндекс» обучил Yandex GPT распознавать собственные галлюцинации, что позволило, если верить компании, сократить их количество в шесть раз. 

Однако разработчики признают: полностью устранить галлюцинации в текущих архитектурах невозможно.

Проблема усугубляется тем, что пользователи, судя по всему, доверяют ИИ-ответам больше, чем обычным поисковым результатам. Красиво оформленный блок с «авторитетным» ответом создает иллюзию надежности, хотя фактически может содержать грубые ошибки. 

Так как теперь искать информацию в интернете?

→ Пользуйтесь расширенным поиском и его операторами

Расширенный поиск остается надежным и куда более непредвзятым инструментом, чем обычный поиск. Зайти в него можно через «Настройки» в нижнем правом углу главной страницы поиска или по прямой ссылке

Здесь вы можете выбрать собственные фильтры, в том числе:

— точный поиск по словосочетанию или фразе

— поиск с альтернативой (или то, или другое)

— на определенном языке

— фильтр результатов по стране, домену или дате обновления

— поиск по файлам

Расширенный поиск основан на так называемых операторах расширенного поиска — то есть коротких текстовых командах, которых у Google существует несколько десятков. Кстати, их задача, вопреки названию, не расширить поиск, а, наоборот, сузить и сделать более точным. Эти операторы можно использовать и в обычном режиме поиска, не переходя в расширенный. Некоторые команды работают и в «Яндексе».

Например, чтобы найти точную фразу или конкретное слово в интернете, без каких-либо изменений, их нужно взять в кавычки. Если же вы хотите, чтобы это слово содержалось не в заголовке или названии страницы, а именно в ее теле, используйте команду Intext. Например: Intext:«Шойгу С. К.». 

Чтобы искать на конкретном сайте, используйте вместе с искомым словом команду site: для Google и host: или url: для «Яндекса». А для поиска документов воспользуйтесь командой filetype: (Google) и mime: («Яндекс»). Например, запрос «„коэффициент материнской смертности“ site:rosstat.gov.ru filetype:xls» поможет найти Excel-таблицы с официальной статистикой материнской смертности на сайте Росстата. А запрос «site:kremlin.ru filetype:pdf лужков» позволит найти единственный доступный на сайте Кремля документ с упоминанием второго мэра Москвы.

Правильное использование операторов поиска позволит вам сократить выдачу до нескольких десятков (а иногда и вообще до нескольких) релевантных результатов. И не забывайте, что следует использовать кавычки-лапки («»), а не ёлочки («»). Кроме того, между оператором и поисковым запросом не должно быть пробелов. 

→ Используйте программируемые поисковые системы 

Google Custom Search Engines (CSE) — это недооцененная технология 2008 года, которая в 2025-м становится жизненно необходимой. CSE позволяет создать собственную поисковую машину, работающую только по выбранным источниками информации и исключающую рекламный мусор.

Основные преимущества CSE — это обход лимита в 300 результатов, то есть CSE может показывать все релевантные страницы; отсутствие спама и ИИ-ответов — вы сами выбираете источники, что сужает спектр поиска и делает его эффективнее. И, конечно, отсутствие рекламы, благодаря чему ваша выдача будет максимально чистой. 

Вот несколько готовых CSE, которые создал я и мои коллеги:

Многие из этих примеров имеют довольно узкую специализацию и вряд ли вам пригодятся, однако есть множество других CSE. Вы можете посмотреть их по этой ссылке

Или же создать собственную поисковую систему, что занимает 15–20 минут и может кардинально улучшить качество исследований. Например, CSE, настроенный на качественные научные журналы, исключит все непроверенные издания и псевдонаучные сайты. Видеоинструкция по настройке собственного движка находится здесь

↘︎ Как с помощью технологий и открытых данных любой человек может следить за ходом боевых действий, фиксировать и даже расследовать военные преступления? Письмо об OSINT

→ Спрашивайте ИИ (но с умом)

Несмотря на все недостатки ИИ, нейросети все же можно использовать для качественного поиска в интернете. Главное правило здесь простое — проверять первоисточники. По моему опыту лучше других ИИ (и с меньшим количеством галлюцинаций) ищет информацию Perplexity — платформа, которая изначально создавалась для поиска в интернете. 

В отличие от классических поисковиков, Perplexity использует собственную модель Sonar и другие языковые модели (ChatGPT, Claude, Grok) для анализа информации и формирует ответы не только на основе загруженной базы данных, но и с учетом актуальных данных из интернета. 

А новые функции 2025 года позволяют в разы сократить время на глубокий поиск. Так, на подробнейший анализ личных и финансовых связей северокорейского лидера Ким Чен Ына уйдет не больше 10 минут. 

Другой полезный инструмент — это Search Whisperer. Его разработал гуру расследований по открытым данным Хенк ван Эсс. Search Whisperer помогает вам сформулировать максимально нейтральный и эффективный поисковый запрос, чтобы вы получили лучшую выдачу, когда будете искать в гугле или «Яндексе». 

Объясню на примере, зачем это нужно. Почти любая формулировка запроса содержит скрытые предположения. Мы сами часто формируем собственные заблуждения. Запрос «почему вакцины опасны?» даст совершенно иные результаты, чем «безопасность вакцин исследования».

Интерфейс Search Whisperer прост, а в методичке «Проверено» есть инструкция на русском по его использованию. 

Другой созданный Хенком ван Эссом инструмент, AI Research Pilot, позволяет выбрать направление исследования и получить готовый текстовый промпт (то есть команду) для других ИИ, в том числе — Perplexity, ChatGPT, Mistral. Собственно, этот промпт и поможет вам получить нужные данные. Инструмент предназначен для журналистов, исследователей, расследователей и аналитиков. Как и у Search Whisperer, интерфейс сервиса англоязычный, но запросы можно отправлять на любых языках. Подробнее о том, как работать с AI Research Pilot, я рассказываю в этом бесплатном вебинаре.  

→ Боритесь с географическими ограничениями

Поисковые системы все активнее персонализируют выдачу по вашему местоположению. По одному и тому же запросу пользователи из разных стран, скорее всего, получат совершенно разные результаты. Возможно — с противоречащими друг другу ссылками. Влияет на результат и устройство, с которого вы ищете информацию.

Так, по запросу «какую книгу в мире воруют чаще всего?» пользователь Android из Казахстана «узнает», что это книга Адитьи Бхаргавы «Грокаем алгоритмы», а пользователю ПК из России Google расскажет, что это Библия. Оба ответа при этом неверны.

Более того: в 2025 году Google официально перейдет на единый домен google.com для всех стран. Поддержка же национальных доменов (таких как google.ru, google.fr, google.de) прекратится. В результате роль алгоритмов только возрастет, и теперь вы не сможете зайти на Goodle другой страны, чтобы сравнить результаты.

Чтобы изменить это, используйте VPN, а также сервисы типа I Search From и Impersonal.me. А при работе с ИИ меняйте язык ввода или уточняйте, что вам нужны результаты из конкретной страны: например, только из США или только из Казахстана.

→ Наконец, еще несколько важных базовых правил поиска

  • Используйте «принцип трех» — всегда искать подтверждение из трех независимых источников.
  • Сознательно ищите опровержения первоначальным находкам. И только после ознакомления с ними делайте выводы.
  • Не принимайте решения на основе единственного поиска или одной поисковой машины. Воспользуйтесь альтернативами: DuckDuckGo, Brave, Bing. У них другие алгоритмы поиска, поэтому вы можете получить иные результаты. А в случае с DuckDuckGo и Brave ваша выдача не будет зависеть от вашего поведения: эти движки не собирают ваши личные данные и не формируют результаты на их основе.
  • Формулируйте запрос в нейтральных терминах.
  • Регулярно чистите cookies и историю поиска (в идеале надо настроить очистку после каждой сессии), чтобы ваши прошлые запросы не влияли на новые.
  • Используйте режим инкогнито для «холодного» поиска (ваши данные не сохраняются в этом режиме).
  • Отключите персонализацию поиска. Это можно сделать в настройках поиска, если вы залогинены в Google.

><{{{.______)

Деградация поисковых систем — это не временная проблема, которая решится обновлением алгоритмов. Это структурный конфликт между коммерческими интересами платформ и потребностями пользователей в достоверной информации. Google и «Яндекс» давно стали рекламными платформами, которые попутно предоставляют поисковые услуги, а не наоборот, как было раньше.

В новой реальности информационного хаоса выживут те, кто освоит альтернативные инструменты и методы поиска. В первую очередь это касается тех, кто работает с информацией профессионально: журналистов, исследователей, аналитиков. Им необходимо инвестировать время в изучение этих инструментов прямо сейчас. Это не просто конкурентное преимущество, это базовая грамотность, необходимая для любой работы с данными.

Правда все еще существует. Но теперь ее нужно не просто найти — ее нужно завоевать.

■︎

31.07.25

Редактор: Андрей Яковлев

■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎■︎

ヾ(。^ω^。)ノ ДРУЗЬЯ KIT ヾ(。^ω^。)ノ

Получать независимую информацию становится все сложнее, и один из надежных способов делать это — использовать приложение «Медузы». Его новая версия (1.3.40) работает еще быстрее и еще лучше обходит блокировки. Например, количество ошибок соединения уменьшилось на 70%. Скачайте приложение по ссылке.

 
 
 
From: Kit <i...@getkit.news>
Date: чт, 31 июл. 2025 г. в 19:40
Subject: ➜ Поиск в интернете сломался. Что делать?
To: <en...@enw.net.ru>


------------- *  ENWL  * ------------
Ecological North West Line * St. Petersburg, Russia
Independent Environmental Net Service
Russian: ENWL (North West), ENWL-inf (FSU), ENWL-misc (any topics)
English: ENWL-eng (world information)
Send information to en...@enw.net.ru
Subscription,Moderator: en...@enw.net.ru
Archive: http://groups.google.com/group/enwl/
New digests see on https://ecodelo.org
 (C) Please refer to exclusive articles of ENWL
-------------------------------------
Reply all
Reply to author
Forward
0 new messages