Нейросети и узкие запросы: как я искал и выбирал дизайн-студию офиса с помощью ИИ и ничего не нашел
Кажется, ИИ сейчас умеет всё на свете и за считанные секунды может найти любую информацию. И если с B2C-запросами примерно так и работает, то с B2B всё немного сложнее: информацию найти труднее, поэтому ИИ часто ошибается.
Я решил это проверить и провести эксперимент: задать нейросети рандомный узкий B2B-запрос «Порекомендуй хорошую студию дизайна офисов в Санкт-Петербурге». Такая формулировка звучит довольно естественно, как если бы вопрос задавал обычный человек: общий, разговорный, без уточнения бюджета, площади, стилистики, сроков и других параметров, которые обычно появляются на более позднем этапе выбора подрядчика из списка топ дизайн-студий.
В результате эксперимента ИИ не справился с задачей, и мне пришлось вручную собирать список. В материале собрал ключевые инсайты по тому, как нейросеть работает с узкими запросами, и практические рекомендации по работе с B2B-запросами в ИИ для бизнеса и обычных пользователей.
Какие нейросети выбрал для анализа: запрос и ответы модели
Для эксперимента я взял пять популярных ИИ-инструментов: ChatGPT, DeepSeek, Gemini и наши отечественные Яндекс Алиса, GigaChat.
И построил эксперимент одинаково для всех моделей. Каждой задал одну и ту же последовательность вопросов:
- Базовый запрос: «Порекомендуй хорошую студию дизайна офисов в Санкт-Петербурге».
- Уточнение: «Почему именно эти студии? По каким критериям ты делал выбор?».
- Вопрос об источниках: «На какие сайты и данные ты опирался?».
- Требование конкретики: «Перечисли конкретные сайты, страницы или типы источников, которые ты анализировал».
Именно эта четырехшаговая схема позволила увидеть не только итоговый список, но и внутреннюю логику моделей: по каким признакам они понимают, кого на рынке считают «хорошей студией». При этом я намеренно не уточнял метраж, бюджет, стиль и другие параметры. Мне было важно проверить, как модели справляются с самым естественным, «человеческим» запросом — тем, с которого в реальной жизни и начинается поиск подрядчика.
В сумме пять моделей выдали 35 рекомендаций — на первый взгляд: все ответы выглядели убедительно. ChatGPT, DeepSeek, Яндекс Алиса, GigaChat и Gemini называли конкретные студии, ссылались на «репутацию», «портфолио», «опыт», «рейтинги или топ дизайн-студий» и «узнаваемость». По тону это были уверенные рекомендации, которые легко принять за экспертный шорт-лист.
В случае этого эксперимента для себя я определил несколько критериев проверки. Студия считалась соответствующей запросу, если одновременно выполнялись несколько условий:
- В открытых источниках должна прослеживаться устойчивая специализация на офисных или общественно-деловых пространствах, а не единичные офисные проекты. При этом офисное направление не должно было выглядеть случайным эпизодом на фоне преимущественно жилого, ресторанного или иного профиля.
- В портфолио должны быть несколько офисных кейсов или хотя бы признаки системной практики: повторяемость в профильных шорт-листах, награды, публикации, наличие нескольких офисных проектов в открытом доступе.
- Должна быть локальная привязка к Санкт-Петербургу — либо физический офис, либо, если речь шла о внешнем бюро, наличие реализованного офисного проекта в Санкт-Петербурге, зафиксированного в открытых источниках.
На этом этапе я проверял только одно: насколько рекомендации ИИ соответствуют исходному пользовательскому запросу. Это не то же, что собрать финальный шорт-лист реальных студий рынка. Шорт-лист — более жесткая и отдельная работа, где помимо релевантности я дополнительно смотрю на профильный контур, открытость рынку и локальность. Но первый шаг должен быть проще и честнее: понять, попала ли модель в запрос вообще.
Важно: я не оценивал студии, исходя из личных предпочтений, и не пытался решить, насколько мне нравится конкретное бюро. Сначала я зафиксировал правила проверки и только потом сопоставлял ответы моделей с этими критериями. Иначе такой эксперимент очень быстро превращается не в исследование, а в субъективную колонку.
Проблема всплыла, когда я вручную проверил каждую рекомендацию. В результате из 35 рекомендаций всего одна оказалась условно релевантной — то есть примерно 97% списка не соответствовало запросу. Модели почти не различают офисную специализацию, смешивают архитектурные бюро с интерьерными студиями широкого профиля, игнорируют географию и подменяют экспертный рынок цифровой видимостью. В сухом остатке результаты списка «топ дизайн-студий» от ИИ выглядели так:
- ChatGPT: 15 рекомендаций, 1 релевантная, попадание ~7%.
- DeepSeek: 7 рекомендаций, 0 релевантных, попадание 0%.
- Яндекс Алиса: 4 рекомендации, 0 релевантных, попадание 0%.
- GigaChat: 5 рекомендаций, 0 релевантных, попадание 0%.
- Gemini: 4 рекомендации, 0 релевантных, попадание 0%.
Итого: 35 рекомендаций, 1 релевантная, общий процент попадания ~3%.
Единственное попадание — в ответе ChatGPT — было условным: студия действительно занимается коммерческими интерьерами, включая офисы, но ее профиль шире и не совпадает с узкой специализацией запроса. То есть даже этот случай нельзя считать стопроцентным попаданием в запрос «студия дизайна офисов в Санкт-Петербурге».
Этот итог в том числе показывает, что проблема не сводится к одному неудачному ответу или слабости конкретной модели. Ошибка одной модели могла бы выглядеть случайностью. Но здесь я увидел другое: разные системы, с разной архитектурой и разной манерой объяснять свой выбор, пришли примерно к одному и тому же результату: уверенно сформировали шорт-лист, который почти не совпадает с исходным запросом.
Именно поэтому данный эксперимент интересен: на узком B2B-запросе ИИ может звучать уверенно, даже когда его рекомендации почти полностью расходятся с реальным положением дел в профессиональной нише.
На первом этапе можно было бы ограничиться выводом, что «нейросети пока плохо рекомендуют подрядчиков в узких нишах». Но сухая статистика — это, отправная точка. Важно не только то, что модели ошиблись, но и как именно они это делали. Потому что дальше станет видно, что типы сбоев повторяются.
Анатомия ошибок: не одна, а несколько повторяющихся типов сбоев
Когда я начал разбирать ответы, стало видно, что модели ошибаются не хаотично, а по повторяемым сценариям.
Ошибка: подмена узкой офисной экспертизы более широким архитектурным полем
Самый показательный пример — DeepSeek. В ответ на запрос о студии дизайна коммерческих интерьеров, а именно офисов в Петербурге, модель выдала список архитектурных бюро: Apex, UNK project, Za bor architects, Studio 44, «Мастерская Мамошина». Ответ звучал солидно, с упором на масштаб, узнаваемость и профессиональный вес. Но после проверки оказалось, что модель искала не тех, кто системно работает с офисными интерьерами, а тех, кто выглядит статусно в широком архитектурном поле, без проверки доли офисных дизайн-проектов в их портфолио.
То есть проблема была не в том, что архитектурные бюро «не подходят» для офисов, а в том, что модель не удержала предмет запроса — устойчивую офисную специализацию.
Ошибка: смешение сегментов
ИИ собирал топ дизайн-студий так, будто офис, жилье, рестораны и общественные пространства относятся к одной категории. Это особенно хорошо видно в ответах ChatGPT и Gemini:
- ChatGPT поставил в один список Studio 44, Studia 54, DKING, «Студию Ольги Мудряковой», Artum, Radical Design Studio, хотя по факту там перемешались архитектурные бюро, частные дизайнеры, студии, которые занимаются жилыми пространствами, и только одно более-менее близкое к запросу бюро.
- Gemini сделал похожий ход: в его списке оказались DA bureau, известное прежде всего ресторанными и общественными проектами, Студия Павла Полынова с широким профилем, LINES Design и METAarchitects.
Во всех случаях модель не отделяла офис как продукт от студии дизайна коммерческих интерьеров.
Ошибка: игнорирование локальности
Запрос был не просто про студию офисов, а про студию в Санкт-Петербурге. Но модели периодически вели себя так, как будто география вторична:
- Яндекс Алиса включила в список Vitta Group, хотя в массиве проверки эта студия всплывает как игрок из Симферополя, а не из Петербурга.
- Gemini не маркировал разницу между локальными петербургскими студиями и сильными внешними бюро, как будто сам факт работы с коммерческими интерьерами уже достаточен, чтобы пройти географический фильтр запроса.
Даже когда модель называла профессионально сильных игроков, она часто не проверяла, соответствуют ли они самому простому условию — поиску студии именно в Петербурге.
Ошибка: иллюзия аргументации и источников
Изначально почти все модели говорили уверенно и подробно. Но затем я попросил объяснить, почему выбрали эти студии и на какие сайты опирались.
ChatGPT сначала рассказывал, что ориентировался на реальные офисные кейсы, архитектурное мышление и адекватный клиентский опыт, а затем признавал, что использует не только профессиональные медиа, но и карты, агрегаторы отзывов, а иногда даже площадки вроде YouDo и Avito как вспомогательные сигналы.
DeepSeek честно уточнил, что не анализировал сайты в реальном времени и работал по обобщенной базе знаний.
GigaChat, наоборот, так и не смог перейти от общих категорий источников к конкретике.
Gemini производил впечатление того, что всё глубоко проверил, но при перечислении источников смешивал Officenext с VC, DTF, Klerk и другими площадками, которые не образуют единый профессиональный контур.
Яндекс Алиса сначала выдала подробный и логично звучащий список студий с аргументацией, будто он основан на реальном анализе (награды, опыт, BIM, отзывы и т. д.). Но когда её спросили про источники, она показала случайные и нерелевантные (например, отзывы сотрудников вместо клиентов), кроме того закрались противоречия (студия из Симферополя в подборке для Петербурга), а часть аргументов (награды, сотрудничество, рейтинги) не подтверждалась реальными данными.
То есть по мере уточнения запроса «экспертность» моделей всё чаще оказывалась либо агрегированным шумом, либо красиво оформленной неопределенностью.
Все четыре типа ошибок показывают, что проблема не в «плохих студиях» и не в том, что модель случайно вспомнила не тех игроков. А в том, что ИИ системно путает тип экспертизы, сегмент, географию и качество сигнала, на который опирается.
Теперь, когда зафиксированы типы ошибок, пора задать главный вопрос: какие внутренние правила заставляют модель раз за разом выбирать цифровой шум вместо профильной экспертизы?
Почему ИИ ошибается: эвристики, которые ломаются на узком B2B-рынке
ИИ используют упрощенные правила отбора — эвристики, которые вполне работают в массовом B2C-поиске, но начинают ломаться, когда сталкиваются с узким профессиональным рынком.
Эвристики — это быстрая числовая оценка варианта, которая говорит алгоритму: «Проверяй это в первую очередь, оно выглядит лучше». Без нее пришлось бы перебирать всё подряд.
Именно определенный набор эвристик — повторяемость, универсальность, цифровая доступность и рейтинги дизайн-студий как прокси доверия — уже просматривается в самом исследовании.
Первая эвристика: повторяемость
Для модели часто упоминаемое выглядит более надежным. Если название всплывает в картах, подборках, отзывах, медиа и рейтингах дизайн-студий, значит, этому можно доверять. В массовом поиске такая логика еще может давать приемлемый результат: если кафе, клиника или салон часто встречаются в локальном цифровом контуре, это хотя бы что-то говорит о заметности и спросе. Но в B2B эта логика дает искажение.
Экспертный консенсус формируют не агрегаторы и SEO-каталоги, а повторяемость сложных проектов, рекомендации внутри профессионального сообщества, премии, шорт-листы и деловая репутация. ИИ почти не различает эти уровни. Он видит не «кого выбирают на рынке», а «кто чаще встречается в доступных и вызывающих доверие источниках» — ИИ чаще смотрит на источники, которые оптимизированы с учетом SEO и находятся в топе поисковых систем.
Вторая эвристика: универсальность
Узкая специализация для модели сложнее, чем широкий профиль. Студия, которая делает всё — квартиры, рестораны, офисы, общественные пространства, — выглядит более устойчивым и непротиворечивым кандидатом, чем бюро, заточенное под один тип задач. Просто потому что универсальная студия чаще упоминается в самых разных контекстах — от жилых интерьеров до общественных пространств, и ее имя всплывает в большем количестве источников.
Для человека это часто наоборот: чем уже специализация, тем выше шанс, что подрядчик глубже понимает конкретный тип объекта. Но модель стремится к безопасной, широкой категории, потому что она лучше подтверждается цифровым следом. В результате вместо студии дизайна коммерческих интерьеров в шорт-лист попадают те, кто просто присутствует в большом поле «дизайна интерьеров».
Третья эвристика: цифровая доступность
Модель лучше считывает то, что хорошо структурировано, размечено и повторяется в интернете. Реальная B2B-экспертиза часто устроена наоборот. Крупные офисные кейсы могут быть под NDA. Самые сильные проекты нередко плохо визуализируются в открытом доступе.
Сайты студий дизайна коммерческих интерьеров порой не размечают кейсы по типу объекта так, чтобы это было понятно машине. Именно поэтому в ответах моделей так часто всплывали студии с богатыми сайтами, активными соцсетями и множеством публикаций в интерьерных или lifestyle-медиа, а не те, чья экспертиза подтверждается закрытыми корпоративными кейсами и повторяемостью в профессиональной среде. В итоге побеждает не тот, у кого глубже экспертиза, а тот, чья экспертиза легче превращается в машиночитаемый сигнал.
Четвертая эвристика: рейтинги дизайн-студий и отзывы
Для B2C рейтинг на картах или поток отзывов действительно могут быть полезным фильтром. Но в узкой B2B-нише высокий рейтинг в Яндекс Картах почти ничего не говорит о том, умеет ли студия проектировать рабочую среду, разбираться в сценариях офисной жизни, учитывать ГОСТы и пожарную безопасность, работать с корпоративными заказчиками и доводить сложный объект до реализации. Ведь работать с бригадой, которая занимается квартирами, — одно, а со студией дизайна коммерческих интерьеров, которая специализируется на офисах, — другое.
Тем не менее для модели такие сигналы очень соблазнительны: они простые, многочисленные и легко сравнимые. Поэтому ИИ так охотно опирается на агрегаторы и локальные карточки компаний, даже когда задача требует совсем другого класса доказательств. Это видно и в нашем разборе: там, где должны были работать профессиональные контуры, в ответах всплывали карты, отзывы и общие рейтинги дизайн-студий.
Именно в этом месте становится понятно, почему ответы моделей выглядели такими уверенными. Они следовали логике, которая вшита в их способ работы с интернетом. Проблема в том, что эта логика лучше приспособлена к массовым услугам, чем к узкой профессиональной экспертизе.
Что ИИ считает рынком: источники, которые формируют цифровой шум
После разбора эвристик становится видно, что модель ошибается не только из-за внутренней логики отбора, но и из-за самого материала, с которым работает. Для ИИ «рынок» — это не профессиональное сообщество, а смесь источников разного качества, глубины и назначения. В исследовании это видно: модели называли и ArchDaily, и Archi.ru, и профильные премии, и одновременно — карты, Zoon, Yell, DreamJob, VC, DTF, Klerk и другие площадки, которые не образуют единый профессиональный контур.
Чтобы не сваливать всё в кучу, такой набор источников полезно разделить на три слоя.
Первый — профильный контур. Это источники, которые помогают понять рынок офисных и общественно-деловых пространств: специализированные офисные и архитектурные медиа, отраслевые премии, шорт-листы, сайты бюро с подтвержденным офисным портфелем, профессиональные кейсы. В моем исследовании к этому контуру относились Best Office Awards от Officenext, Archi.ru, ArchDaily, Project Russia, ADD Awards и аналогичные площадки. Они не гарантируют идеальную рекомендацию, но работают с рынком.
Второй — квазипрофильный контур. Это интерьерные медиа, lifestyle-издания, дизайн-платформы и портфолио-сайты вроде AD, Salon, Interior.ru, Design Mate, Behance, соцсети студий — всё это может помогать увидеть стиль, медийность и культурный контекст, но почти не помогает ответить на вопрос, кто системно работает с офисами как с отдельной профессиональной дисциплиной. Именно на этом слое модель путает офисы, рестораны, апарт-отели, жилые интерьеры и в целом дизайн коммерческих интерьеров.
Третий — цифровой шум. Это карты, агрегаторы отзывов, общие рейтинги дизайн-студий, каталоги «всех дизайнеров подряд», городские подборки и сервисные платформы вроде YouDo, Profi или Avito. Такие источники помогают проверить адрес, часы работы, количество отзывов, базовую заметность компании. Но почти ничего не говорят о глубине офисной экспертизы. Тем не менее модель на них ориентируется, потому что они легко читаются, массово повторяются и дают иллюзию количественной надежности.
В итоге разница между моделями в пропорции этих слоев:
- ChatGPT оказался ближе всех к архитектурно-профессиональному контуру, но всё равно смешивал профильные варианты с интерьерными медиа, картами, отзывами и вспомогательными площадками.
- DeepSeek лучше других воспроизводил архитектурное поле, но именно поэтому часто тянул в выдачу архитектурные бюро, а не студии с более узкой офисной специализацией.
- Gemini создавал иллюзию глубины за счет большого числа названных источников, но внутри этого списка спокойно соседствовали Officenext, Best Office Awards, VC, DTF и Klerk.
- Яндекс Алиса почти полностью жила в слое локальной видимости и отзывов, поэтому ее рекомендации оказались ближе к расширенному справочнику, чем к профессиональному анализу.
- GigaChat вообще не смог прозрачно показать, на чем строится его картина рынка.
Если посмотреть на ответы моделей под этим углом, становится видна закономерность: чем выше доля непрофильных источников, тем дальше итоговый список от реального рынка.
Нейросети vs ручной отбор: кто отвечает на запрос о студии дизайна офисов в Петербурге
Чтобы не повторять ошибку нейросетей, я не собирал собственный список, опираясь на информацию из интернета, карт и агрегаторов отзывов. Я взял более узкую и проверяемую выборку — номинантов Best Office Awards SPb 2024–2025 на Officenext. Затем оставил только офисные, сервисно-офисные и коворкинговые проекты, разделил студии на локальные и внешние бюро, которые работают в петербургском контуре, но не базируются в городе.
Внутри выборки смотрел на четыре момента:
- Есть ли у бюро офисные проекты в Петербурге.
Понятно ли с первого взгляда, что бюро работает именно с офисами.
Есть ли один или несколько релевантных проектов за 2024–2025 год.
Насколько устойчивая специализация: офисы в портфолио — единичный проект или есть серия похожих кейсов.
То есть я ориентировался на списки номинантов в Best Office Awards SPb 2024–2025 на Officenext, официальные сайты студий и их публичное позиционирование.
Рейтинг дизайн-студий офиса в Санкт-Петербурге
По этой методике у меня получился такой рейтинг дизайн-студий.
- Designic. Есть офис в Санкт-Петербурге на Малом проспекте Петроградской стороны, 5Б, на официальном сайте выделены офисы и деловые пространства, а в номинантском контуре 2024 года сразу два релевантных проекта — Kazanskaya PAGE и Qvant. Designic попадает под три нужных критерия — локальность, понятную специализацию и повторяемость кейсов.
- Hubarch. Студия находится в Петербурге, в открытых источниках за 2024 год здесь у них числится два проекта — Solopharm и «Практик Чехова», а в собственном портфолио есть и более ранние петербургские проекты вроде «Практик Гороховая» и «Проспект». У бюро есть серия проектов одного типа в городе.
- BRIZ Studio. Есть петербургский адрес, а в профильном контуре студия появляется два года подряд: в 2024 году с проектом «ВКонтакте», в 2025 году — с «Авиасейлс». Даже если смотреть только на открытые и проверяемые сигналы, этого уже достаточно, чтобы считать BRIZ устойчивым локальным игроком в офисном сегменте.
- AIKIdesign. В открытом доступе у студии несколько релевантных петербургских проектов — Benua Campus Page, Park Page и офис продаж «Скороход» в списке 2024 года, на собственном сайте есть и внешние офисные кейсы, например офис «Деловые линии». Кроме того, они находятся в Петербурге.
- Radical Design. Есть офис в Петербурге, в 2024 году фигурируют несколько проектов: Bell integrator, U-Apart и «Невская базилика», а в 2025 году — Aurix. Это заметный игрок внутри выборки. Но в публичном поле выглядит менее сфокусированным, чем Designic, менее серийным, чем Hubarch, и менее устойчивым по повторяемости сигналов, чем BRIZ.
Внешние (из других городов):
- OFFCON. У бюро московская база, но в открытом контуре можно найти проект «Школа Яндекса» в 2024 году и «Т-Технологии» — в 2025. Это не случайное присутствие, а повторяемый внешний сигнал в нужной географии.
- UNK corporate interiors. В профиле компании на Officenext сказано, что бюро занимается дизайном корпоративных интерьеров, а в петербургском контуре за 2024 год есть проект «ЭР-Телеком». Здесь важна чистота совпадения с запросом «корпоративные интерьеры плюс подтвержденный кейс в Петербурге».
- 'nefa'architects'. Заметный офисный профиль и два петербургских проекта «Яндекса» в контуре за 2025 год. Есть специализация, повторяемый сигнал и прямое присутствие в локальном профессиональном контуре.
- IND. В контуре 2025 года у бюро есть петербургский проект «Многопрофильная компания», а в открытом позиционировании студия считывается как бюро с сильной офисной практикой. Попадает во внешнюю группу не как «самое крупное по цифрам», а как релевантный игрок с подтвержденным проектом в Петербурге и понятным офисным профилем.
Главный смысл этой выборки такой: если убрать агрегаторный шум и смотреть только на открытый профильный контур, список становится жестче и понятнее. В нем остаются не самые громкие по цифровому следу, а те, у кого есть проверяемые основания для попадания в ответ на исходный запрос: офисная специализация, локальность или подтвержденная работа в Петербурге, повторяемость и присутствие в профессиональной среде.
Что это значит для бизнеса и для студий
Мой эксперимент показал, что общий запрос без дополнительных фильтров слишком легко превращается в список заметных по цифрам, а не профессионально релевантных игроков: 35 рекомендаций, одно условное попадание. Поскольку модели системно путают сегменты, игнорируют географию и смешивают профессиональные сигналы с цифровым SEO и поведенческим шумом, уточнение этих параметров в запросе резко сужает поле для ошибки.
Если все-таки использовать ИИ в прикладной работе, формулировать запрос нужно еще конкретнее. Не «порекомендуй хорошую студию», а, например, «Найди студии с офисными проектами в Санкт-Петербурге, у которых есть подтвержденные кейсы в профильных шорт-листах за последние два года». Чем ближе запрос к проверяемым признакам — тип объекта, город, масштаб, награды, публикации, — тем меньше пространства для цифрового шума и выше шанс получить полезный список. Это напрямую следует из всей логики эксперимента: модели лучше справляются тогда, когда им труднее перепутать сигналы разного класса.
И также не стоит доверять первому красивому списку и думать, что уверенный тон равен качественной рекомендации. На узком рынке ИИ сегодня он скорее помогает начать поиск, чем завершить его.
Для студий вывод можно сделать такой: на рынке уже недостаточно просто быть сильным игроком. Нужно, чтобы эта сила читалась без участия человека. Нужно делать специализацию машиночитаемой:
- явно размечать кейсы по типу объекта,
- не прятать офисные проекты в общий поток «дизайна коммерческих интерьеров»,
- показывать географию,
- фиксировать участие в профильных премиях и не рассчитывать, что сильная репутация «сама как-нибудь считается».
Например, вместо расплывчатого «Коммерческий интерьер в бизнес-центре» лучше писать «Офис IT-компании, 500 м², Санкт-Петербург, 2024». Во втором случае и человеку, и машине намного легче понять, что перед ними не абстрактный кейс, а конкретный маркер специализации.
Но прежде чем ставить точку, важно честно обозначить границы самого эксперимента — что он действительно доказывает, а что остается за его рамками.
Ограничения эксперимента
У исследования есть границы. Я тестировал один тип естественного запроса — общий, разговорный, без уточнения бюджета, площади, стилистики, сроков и других параметров, которые обычно появляются уже на более позднем этапе выбора подрядчика. Я сделал это намерено, чтобы проверить не идеальный сценарий с длинным брифом, а самый типичный пользовательский заход в ИИ-ассистент.
Кроме того, я анализировал первый уровень рекомендаций, а не результат глубокого многошагового диалога. Теоретически модель могла бы улучшить список после серии уточняющих вопросов. Но именно первый ответ в таких системах чаще всего и работает как стартовая точка для дальнейшего выбора. Поэтому для целей этого материала было важно проверить, что происходит именно на входе.
Есть и еще одно ограничение: исследование касается одной профессиональной ниши — дизайна офисов и коммерческих интерьеров — и одного города — Санкт-Петербурга. Из этого нельзя автоматически делать вывод, что любая рекомендация ИИ в любой B2B-категории будет такой же слабой. Но можно сделать более аккуратный вывод: в нишах, где экспертный рынок плохо переводится в машиночитаемый контур, риск нерелевантной выдачи заметно выше.
Наконец, ответы моделей меняются со временем. Я проводил этот эксперимент в феврале-марте 2026 года, в будущем часть формулировок, логики или даже списков источников у моделей может измениться. Но для материала важна не только конкретная дата теста, а то, что на момент проверки разные системы воспроизвели один и тот же тип сбоя: уверенную рекомендацию при слабом соответствии исходному запросу. Именно повторяемость этого сбоя в разных системах делает эксперимент показательным, несмотря на его локальность.
Заключение
Эксперимент важен потому, что на простом и естественном запросе — «Порекомендуй хорошую студию дизайна офисов в Санкт-Петербурге» — разные ИИ-системы почти синхронно показали одну и ту же картину рынка. И эта картина оказалась очень далека от реальной профессиональной структуры. Тот самый простой вопрос, с которого всё началось, оказался для моделей тестом на умение собирать цифровой шум.
В этом смысле ИИ отразил скорее цифровую оболочку рынка: то, что лучше всего индексируется, чаще всего повторяется и легче всего превращается в машиночитаемый сигнал. Именно поэтому главный вывод этой статьи не сводится к фразе «ИИ пока не умеет рекомендовать подрядчиков». Умеет — но по тем правилам, которые встроены в публичный интернет.
Сегодня при работе с ИИ выигрывает тот, чье присутствие лучше размечено и чаще встречается в доступных источниках. Поэтому человеку всё еще обязательно нужно проверять рекомендации нейросети, а бизнесу — описывать, маркировать и связывать свою работу с доказательствами так, чтобы она была понятна не только человеку, но и машине.