Что в имени тебе моем: откуда нейросеть берет информацию о вашей компании
Когда-то давно текстовый контент в интернете можно было разделить на две категории: тексты для людей и SEO-тексты для поисковиков.
Сейчас мы пришли к новому этапу — нужно писать текст, в том числе для роботов, которые потом из этого сделают выжимку с ключевой информацией для человека.
Количество поисковых запросов через нейросеть растет и я решил изучить: на какие источники они опираются, когда дают справку или рекомендуют те или иные компании.
Для примера решил взять близкую для себя сферу — агентства, которые занимаются организацией корпоративных мероприятий: от маркетинговых презентаций и интеграций в фестивали до тимбилинга и новогодних корпоративов.
Как считал
Я взял ключевые генеративные нейросетевые чат-боты, которые сейчас популярны в России: яндексовская Алиса, ChatGPT, GigaChat от Сбера, китайский DeepSeek и Grok от Илона Маска.
И прогнал по всем больше 100 запросов, так или иначе связанным с ивентом. Примеры запросов:
- Какие проекты реализовало агентство X? Для составления списка агентств ориентировался на National Event Service Rating, где присутствуют многие ведущие компании рынка.
- Чем занимается человек Y? Здесь вбивал лидеров мнений в индустрии: Юлия Жоля, Игорь Лютенко, Ирина Михалькова и др.
- Просил рекомендовать агентство для организации мероприятия с определенными параметрами
В некоторых нейросетях напрямую прилагается список источников. Некоторые сети приходилось “пытать” дополнительно и уточнять откуда была взята та или иная ключевая информация по запросу.
На скринах пример из GigaChat. Вначале он дал отсылку на какой-то непонятный ресурс srochnodengi (?!). И только после уточнений выяснил, что на самом деле речь идет о статье в Известиях.
Вывод 1. Официальный сайт — важный источник информации о компании, но не самый популярный
Алгоритм нейросетей умеет распознавать категорию источника информации. Поэтому для создания объективной картины и ответа на запрос чат-боты старались давать информацию и отсылки на максимально широкий перечень источников. Причем официальные сайты оказались не на первом месте!
В целом можно выделить 5 основных категорий источников:
- Отраслевые СМИ (sostav.ru, event.ru, event-live.ru и другие). Они являются основой для ответа по запросам — 37,8% от всех источников информации. Причем на них ориентируются все проанализированные нейросети без исключения. Поэтому если вы хотите полной и объективной информации о себе в ответах нейросетей — нужно как-то интегрироваться в отраслевые медиа, будь то авторская статья, интервью или разбор кейса.
- На официальные сайты пришлось 22% от всех источников информации.
- Федеральные СМИ набрали 10%. Про ивент-отрасль пишут не так часто, но экспертные комментарии в крупных изданиях неплохо считываются нейросетями.
- Информация с сайтов премий и различных рейтингов — 9%
- Профили компаний на сайтах отраслевых ассоциаций, в первую очередь НАОМ и АКМР — почти 6%
Оставшуюся часть источников — 14% — сложно отнести к одной категории. Сюда вошли сайты отраслевых конференций, профили компаний на HH и другие источники.
Вывод 2. Аффилированность контента распознается слабо
И в этом нет противоречия с первым пунктом. Алгоритм по умолчанию действительно пытается найти информацию по максимальному количеству разных категорий источников. При этом не сильно обращает внимание на то, насколько он может быть объективным в контексте конкретного запроса.
Запрашиваете отзывы о компании — пожалуйста, вот отзывы не с Яндекс.Карт, а опубликованные прямо на официальном сайте (конечно, хвалебные).
Ищите лучшие ивент-агентства — вот публикация из блога на VC, где чуть ли не агентство само себя называет лучшим.
Так что помимо публикации своих кейсов на внешних площадках, нужно ставить и регулярно обновлять текстовый контент и на собственных ресурсах, будь то блог на сайте или соцсети. Нейросеть их примет “на ура”.
Вывод 3. Адекватность ответов высокая, но не идеальная
Практически по всем запросам получил более-менее адекватный ответ, за исключением, пожалуй, запросов в DeepSeek. Который назвал организацию свадеб ключевым направлением Redday (известной, в первую очередь, на корпоративном рынке). К свадьбам он вообще неравнодушен и аналогичную услугу по организации частных мероприятий почему-то предлагал от имени агентства Team For Dream, которое также ими не занимается.
А для портфолио Avantage Event Project он зачем-то придумал победу на несуществующей (!) премии Prestige Event Awards. При том что у агентства достаточно наград на вполне настоящих отраслевых премиях, включая Событие года и bema.
За исключением DeepSeek, которое непонятно что может вылечить, в остальных случаях лучший способ повысить точность — дать большой выбор разноформатных источников. Тогда и будет меньше “фантазий” со стороны нейросети.