Будущее LLM-поиска и какие источники используют нейросети для подготовки ответа пользователю? + 3 мнения SEO-экспертов
Сегодня, команда Пиксель Тулс, расскажет вам, какие источники цитируют поисковые системы искусственного интеллекта? Результаты глубокого анализа 40 000 ответов и 250 000 источников. Узнайте, что думают российские эксперты в мире SEO и какой прогноз трафика из LLM-поиска ожидается в ближайшие годы.
Поисковые системы с искусственным интеллектом, такие как ChatGPT, Perplexity и Gemini от Google, радикально меняют способы поиска информации пользователями — часто в рамках одного разговора. Команда xfunnel.ai отслеживает работу этих систем и провела исследование, проанализировав 250 000 ссылок из 40 000 ответов ИИ, чтобы определить, какие источники предпочитают инструменты ИИ.
Подход
Сбор данных
Были проанализированы 40 000 ответов из ChatGPT, Perplexity и Gemini, собрав 250 000 уникальных исходящих ссылок при помощи генерации огромного количества вопросов к вышеуказанным нейросетям. На протяжении всего исследования были изучены модели пользовательского интерфейса для всех движков, которые периодически менялись в течение периода измерения по мере того, как платформы развивали свои предложения.
Типы цитирования
● Собственные. Собственный домен компании.
● Конкуренты. Домен прямого конкурента.
● Внешние источники. Сторонние или партнерские сайты, часто требующие какого-либо внешнего листинга или освещения.
● Пользовательский контент. Например, Reddit, G2, Trustpilot.
Авторитет домена
Домены сгруппированы по показателю Domain Authority каждого домена (по данным Moz) по диапазонам: 0-19, 20-39, 40-59, 60-79, 80-100.
Этапы пути пользователя
Каждый вопрос был разделен на следующие категории: изучение_проблемы, изучение_решения, сравнение_решений, окончательное_исследование или оценка_решения.
Среднее количество цитирований по движку искусственного интеллекта
Итог:
● Perplexity: ~ 6,61 цитирования на один ответ.
● Google Gemini: ~ 6,1 цитирования на ответ.
● ChatGPT: ~ 2,62 цитирования на один ответ.
Согласно последним данным о посещаемости, ChatGPT лидирует на рынке ИИ-поиска с 3,8 млрд ежемесячных посещений, Google Gemini получает около 267,70 млн посещений, а Perplexity привлекает 99,50 млн ежемесячных посетителей.
Perplexity и Gemini, похоже, добавляют ссылки на источники, привлекая более широкий спектр источников. В рамках эксперимента, было разрешено ChatGPT самому решать, когда использовать цитаты (а нецеленаправленно включать режим поиска или глубокого исследования). При использовании этого сценария ChatGPT ссылался на меньшее количество источников, хотя этот процесс быстро развивается по мере более глубокой интеграции возможностей поиска и глубокого исследования. Было также отмечено, как Gemini меняет порядок включения ссылок — теперь модель не включает ссылки в каждый ответ, а выбирает, когда их включать.
«Масштабирование Gemini на стороне потребителей будет нашим главным направлением в следующем году»
Сообщил Сундар Пичаи, генеральный директор Google.
Авторитет домена по-прежнему имеет значение
Из 250 тысяч ссылок, которые были проанализированы:
● Авторитет домена 80-100 ~31.53%.
● Авторитет домена 40-59 ~26,32%.
● Авторитет домена 20-39 ~22,07%.
● Авторитет домена 60-79 ~15,33%.
● Авторитет домена 0-19 ~4,76%.
В то время как сайты с очень низким уровнем авторитетности (0-19) появляются редко, домены с 20+ авторитетом появляются чаще. Определенное предпочтение отдается более сильным доменам, конечно, чаще лидирует авторитет высшего уровня (80-100). Сюда входят многие партнерские сайты и блоги, которые имеют заметное влияние в результатах поиска AI.
Мы спросили наших коллег по цеху: «Какие, на ваш взгляд, основные параметры сайтов, которые будут рассматриваться далее ИИ при выборе источника цитирования и показу ответа пользователю?»
«Сейчас это такие факторы как:
1. Хорошая видимость и позиции по близким к промпту запросам в выдаче Bing.
2. Высокий авторитет ресурса: посещаемость, ссылки, упоминания, возраст, ...
3. Аналитическая информация и информация от первоисточника, без «перекоса», скажем, в сторону альтернативной медицины.
4. Дата публикации и актуальность. То есть, более новые материалы будут иметь преимущество.
5. Наличие и самого авторитетность автора или издания»
Дмитрий Севальнев, Евангелист Пиксель Тулс, Руководитель Пиксель Плюс.
«На мой взгляд, основные параметры сайтов, которые будут рассматриваться ИИ при выборе источника цитирования и показе ответа пользователю, включают:
● Релевантность и качество контента.
● Трафик, поисковая видимость и авторитет сайта в поисковых системах. Этот пункт тесно связан с алгоритмом E-E-A-T.
● Юзабилити и удобство использования. ИИ будет учитывать, насколько легко пользователям ориентироваться на сайте и находить нужную информацию.
● Актуальность и свежесть информации. Нейросети, как и поисковики, отдают предпочтение сайтам с регулярно обновляемым контентом.
● Уникальность и оригинальность контента. Мне, как создателю авторского контента, очень бы хотелось, чтобы этот пункт был одним из самых важных.
● Структурированность и форматирование контента. Хорошо организованная информация легче для восприятия пользователями и поисковыми ботами.
● Вовлеченность пользователей, такие как время на сайте, глубина просмотров и процент отказов»
Михаил Шакин, SEO-эксперт, автор блога shakin.ru.
«То, что сейчас цитируется в LLM-поиске сильно зависит от ранжирования в классическом поиске. На мой взгляд, из значимых факторов при выборе источника цитирования — популярность сайта (как вариант, число упоминаний), сила бренда, возраст, коммерческие/E-E-A-T факторы.
Доверие к ИИ-ответам — ключевой момент. Цитируя надежные известные источники, LLM-поиск может увеличить доверие к себе, как к технологии. Немаловажные факторы — релевантность и актуальность информации.
С другой стороны, современное классическое SEO настолько усложнилось, что все эти факторы уже закладываются в стратегию оптимизации. Основная задача SEO-специалиста будет в выявлении долей факторов и направлении ресурсов на наиболее приоритетные (в том случае, если LLM-поиск займет значимую долю)»
Сергей Сосновский, SEO-эксперт, автор блога sosnovskij.ru.
Типы цитирования. Внешние источники доминируют, пользовательский контент тоже на подъеме
Внешние источники (сторонние, редакционные или партнерские) остаются самым частым типом цитирования в ChatGPT, Gemini и Perplexity.
Данные показывают сильное присутствие партнерских сайтов и блогов наряду с пользовательским контентом форумов. По мере того как системы искусственного интеллекта будут улучшать свои результаты, эти источники будут иметь значительный вес в формировании окончательных ответов, и маркетологам следует обратить на это внимание, поскольку поисковые системы искусственного интеллекта набирают обороты.
Цитирование на протяжении всего пути пользователя
Итог:
● Ранние стадии (исследование_проблемы, обучение_решению). Большая зависимость от заработанного (пресса, сторонние сайты).
● Средняя стадия (решение_сравнение). Заметное увеличение пользовательского контента, указывающее на то, что покупателям нужны отзывы коллег или опыт из первых рук.
● Поздние этапы (окончательное_исследование, оценка_решения). Более частое упоминание собственных доменов и доменов конкурентов для получения подробной информации о продукте.
Полученные данные свидетельствуют, что от верхней к нижней части воронки движки ИИ смещаются от широких сторонних мнений (Earned) к более ориентированным на пользователя или конкретный бренд источникам (UGC, Owned). Это развивающееся сочетание, которое показывает, как протекает процесс обсуждения от выявления проблемы до принятия окончательного решения.
Как наши SEO-эксперты оценивают долю трафика из LLM-поиска на текущий момент?
«Если в целом, то долю в Рунете оцениваю как небольшую, скорее даже, незначительную. Но здесь нюансы. Я бы разделил LLM-поиск на 2 типа:
1. Чат-боты (Chat GPT, Deepseek, Perplexity и т.п). Пока здесь основной интент пользователя — работа внутри сервиса (генерация текста/изображений, кодинг), а не поиск информации. То есть пользователь приходит в чаты осознанно и в основном не для поиска информации (хождения по сайтам), а за конечным продуктом.
Их процент в доли трафика на сайтах сейчас вряд ли больше 1%. По крайней мере, максимально то, что я видел — это 0,5%. Единственное, что их выделяет — хорошие внутренние поведенческие метрики (отказы, количество страниц за сеанс, время на сайте).
2. ИИ-блоки в выдаче классических поисковиков (Яндекс/Google). Пользователь их получает неосознанно. Сложность выделения и аналитики трафика с подобных блоков.
Также объем трафика из LLM-поиска сильно зависит от типа запросов/контента (информационный/коммерческий), тематики. Условно в гиковском инфотрафике будет больше переходов, чем в бытовом коммерческом»
Сергей Сосновский, SEO-эксперт, автор блога sosnovskij.ru.
«Для своих и клиентских проектов можно настроить отчет об LLM трафике в Google Analytics 4. Также можно использовать шаблон Looker Studio от Flow Agency для сравнения LLM трафика с органическим. Для анализа LLM трафика на сайтах конкурентов инструментов я пока не встречал. Возможно, с выходом LLM Chatbot Explorer от Ahrefs появится возможность это сделать. Думаю, такие инструменты очень скоро появятся»
Михаил Шакин, SEO-эксперт, автор блога shakin.ru.
«Пока это всего не более 0.25-0.5%, но стоит вспомнить, что ещё около года назад это было 0%!
Тренд роста числа запросов к LLM-поискам очень интересный и, наверняка, уже скоро пойдут коммерческие заказы на такие услуги:
● Улучшение репутации сайта и персоны в результатах ИИ.
● Повышение авторитетности домена.
● Увеличение числа упоминаний как источников и переходов на сайт»
Дмитрий Севальнев, Евангелист Пиксель Тулс, Руководитель Пиксель Плюс.
Размер компании и предпочтения источников
Анализ охватывал организации с числом сотрудников от <100 до 50 000+. Во всех сегментах наиболее часто цитируемым типом остается Внешний источник (Earned). Однако по мере анализа более крупных компаний наблюдался постепенный рост числа ссылок на источники ИИ в поисковых системах из собственных доменов компаний (Owned).
Чем крупнее компания, тем больше вероятность того, что поисковые системы ИИ будут ссылаться на сайт самого бренда или его ближайших конкурентов. Эта закономерность говорит, что крупные предприятия имеют более узнаваемые домены, что заставляет поисковые системы чаще ссылаться в ответах на большие корпорации.
Откуда берутся ссылки на пользовательский контент?
Как правило, пользовательский контент появляется преимущественно на таких платформах, как Reddit, YouTube, G2, GitHub и Medium. Однако разные поисковые системы с искусственным интеллектом предпочитают разные «горячие точки» пользовательского контента, что отражает подход каждой платформы к индексированию.
Даже в рамках широкой категории «пользовательский контент» каждая поисковая система опирается на уникальный кластер обзорных платформ, форумов и социальных сайтов. Perplexity в значительной степени ориентируется на YouTube и PeerSpot, в то время как Gemini выделяет Medium, Reddit и YouTube, а ChatGPT часто упоминает LinkedIn, G2 и Gartner Peer Reviews. Такое разнообразие говорит, что ИИ-краулеры различаются в своих стратегиях индексирования и со временем могут интегрировать новые платформы.
Выводы
Изучив 250 000 ссылок на 40 000 ответов ИИ, команда xfunnel.ai увидела, как авторитетность домена, внешние источники, СМИ и пользовательский контент определяют то, на что поисковые ИИ-системы предпочитают ссылаться. В то время как Perplexity и Gemini в значительной степени опираются на данные, получаемые в режиме реального времени, подход ChatGPT, хотя и развивается, все еще демонстрирует уникальное сочетание источников, включая пользовательский контент и аффилированные домены.
Напоследок, мы спросили у коллег: «Какой прогноз на рост трафика из такого поиска, на ваш взгляд, актуален на ближайшие пару лет?»
«Основываясь на текущих тенденциях и исследованиях, можно ожидать значительный рост трафика из LLM-поиска в ближайшие пару лет.
Например, по этому прогнозу органический трафик на сайты брендов уменьшится на 50% к 2028 году, так как будет расти LLM трафик.
Я считаю, что поисковые системы потеряют минимум 20-30% своего трафика в ближайшие годы, так как значительная часть пользователей будет искать информацию в нейросетях. Особенно это касается молодого поколения»
Михаил Шакин, SEO-эксперт, автор блога shakin.ru.
«Учитывая, что Google не будет сдаваться без боя, да и Яндекс развивает свой «поиск с нейро», я бы поставил на долю в 2.5-3.5% через 2 года. Внимательно следим за развитием событий»
Дмитрий Севальнев, Евангилист Пиксель Тулс, Руководитель Пиксель Плюс.
«В процентном соотношении будет кратный рост. Постепенно меняется концепция поиска информации (в основном у молодых/юных пользователей). Идет трансформация от поиска к получению информации. Будет появляться группа пользователей, для которых условный Chat GPT будет «стартовой страницей» (вместо Яндекса/Google).
Частота появления ИИ-блоков в классическом поиске также будет увеличиваться. Но это как быстрые ответы, колдунщики — тенденция увеличения zero-кликов в SEO наметилась задолго до активного внедрения нейросетей.
В абсолютных значениях, полагаю, что значимый (измеряемый десятками процентов доли поискового рынка) перекос в сторону LLM в ближайшие годы не будет. Привычка «гуглить» сильно закрепилась у пользователей. Да и качество ответов пока не всегда оправдывает ожидания»
Сергей Сосновский, SEO-эксперт, автор блога sosnovskij.ru.
По мере развития этих ИИ-технологий ожидается изменения в способах поиска и цитирования веб-контента. Понимая данные, лежащие в основе результатов, маркетологи и SEO-команды смогут лучше влиять на то, как их бренд появляется (или не появляется) в покупательских маршрутах в поисковых системах с искусственным интеллектом. Ведь уже совсем скоро, ИИ-поиск займет большую часть на рынке поисковых систем и все проекты необходимо будет адаптировать под эти реалии.
Подписывайтесь на наш канал YouTube, чат Telegram и группу ВКонтакте, чтобы стать частью дружной SEO-тусовки.