Нейросети и узкие запросы: как я искал и выбирал дизайн-студию офиса с помощью ИИ и ничего не нашел

Кажется, ИИ сейчас умеет всё на свете и за считанные секунды может найти любую информацию. И если с B2C-запросами примерно так и работает, то с B2B всё немного сложнее: информацию найти труднее, поэтому ИИ часто ошибается.

Я решил это проверить и провести эксперимент: задать нейросети рандомный узкий B2B-запрос «Порекомендуй хорошую студию дизайна офисов в Санкт-Петербурге». Такая формулировка звучит довольно естественно, как если бы вопрос задавал обычный человек: общий, разговорный, без уточнения бюджета, площади, стилистики, сроков и других параметров, которые обычно появляются на более позднем этапе выбора подрядчика из списка топ дизайн-студий.

В результате эксперимента ИИ не справился с задачей, и мне пришлось вручную собирать список. В материале собрал ключевые инсайты по тому, как нейросеть работает с узкими запросами, и практические рекомендации по работе с B2B-запросами в ИИ для бизнеса и обычных пользователей.

Для эксперимента я взял пять популярных ИИ-инструментов: ChatGPT, DeepSeek, Gemini и наши отечественные Яндекс Алиса, GigaChat.

И построил эксперимент одинаково для всех моделей. Каждой задал одну и ту же последовательность вопросов:

Базовый запрос: «Порекомендуй хорошую студию дизайна офисов в Санкт-Петербурге».
Уточнение: «Почему именно эти студии? По каким критериям ты делал выбор?».
Вопрос об источниках: «На какие сайты и данные ты опирался?».
Требование конкретики: «Перечисли конкретные сайты, страницы или типы источников, которые ты анализировал».

Именно эта четырехшаговая схема позволила увидеть не только итоговый список, но и внутреннюю логику моделей: по каким признакам они понимают, кого на рынке считают «хорошей студией». При этом я намеренно не уточнял метраж, бюджет, стиль и другие параметры. Мне было важно проверить, как модели справляются с самым естественным, «человеческим» запросом — тем, с которого в реальной жизни и начинается поиск подрядчика.

В сумме пять моделей выдали 35 рекомендаций — на первый взгляд: все ответы выглядели убедительно. ChatGPT, DeepSeek, Яндекс Алиса, GigaChat и Gemini называли конкретные студии, ссылались на «репутацию», «портфолио», «опыт», «рейтинги или топ дизайн-студий» и «узнаваемость». По тону это были уверенные рекомендации, которые легко принять за экспертный шорт-лист.

Вверху представлен только пример. Все <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">скрины </a>ответов для ознакомления <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">здесь</a>.

В случае этого эксперимента для себя я определил несколько критериев проверки. Студия считалась соответствующей запросу, если одновременно выполнялись несколько условий:

В открытых источниках должна прослеживаться устойчивая специализация на офисных или общественно-деловых пространствах, а не единичные офисные проекты. При этом офисное направление не должно было выглядеть случайным эпизодом на фоне преимущественно жилого, ресторанного или иного профиля.
В портфолио должны быть несколько офисных кейсов или хотя бы признаки системной практики: повторяемость в профильных шорт-листах, награды, публикации, наличие нескольких офисных проектов в открытом доступе.
Должна быть локальная привязка к Санкт-Петербургу — либо физический офис, либо, если речь шла о внешнем бюро, наличие реализованного офисного проекта в Санкт-Петербурге, зафиксированного в открытых источниках.

На этом этапе я проверял только одно: насколько рекомендации ИИ соответствуют исходному пользовательскому запросу. Это не то же, что собрать финальный шорт-лист реальных студий рынка. Шорт-лист — более жесткая и отдельная работа, где помимо релевантности я дополнительно смотрю на профильный контур, открытость рынку и локальность. Но первый шаг должен быть проще и честнее: понять, попала ли модель в запрос вообще.

Важно: я не оценивал студии, исходя из личных предпочтений, и не пытался решить, насколько мне нравится конкретное бюро. Сначала я зафиксировал правила проверки и только потом сопоставлял ответы моделей с этими критериями. Иначе такой эксперимент очень быстро превращается не в исследование, а в субъективную колонку.

Проблема всплыла, когда я вручную проверил каждую рекомендацию. В результате из 35 рекомендаций всего одна оказалась условно релевантной — то есть примерно 97% списка не соответствовало запросу. Модели почти не различают офисную специализацию, смешивают архитектурные бюро с интерьерными студиями широкого профиля, игнорируют географию и подменяют экспертный рынок цифровой видимостью. В сухом остатке результаты списка «топ дизайн-студий» от ИИ выглядели так:

ChatGPT: 15 рекомендаций, 1 релевантная, попадание ~7%.
DeepSeek: 7 рекомендаций, 0 релевантных, попадание 0%.
Яндекс Алиса: 4 рекомендации, 0 релевантных, попадание 0%.
GigaChat: 5 рекомендаций, 0 релевантных, попадание 0%.
Gemini: 4 рекомендации, 0 релевантных, попадание 0%.

Итого: 35 рекомендаций, 1 релевантная, общий процент попадания ~3%.

Единственное попадание — в ответе ChatGPT — было условным: студия действительно занимается коммерческими интерьерами, включая офисы, но ее профиль шире и не совпадает с узкой специализацией запроса. То есть даже этот случай нельзя считать стопроцентным попаданием в запрос «студия дизайна офисов в Санкт-Петербурге».

Этот итог в том числе показывает, что проблема не сводится к одному неудачному ответу или слабости конкретной модели. Ошибка одной модели могла бы выглядеть случайностью. Но здесь я увидел другое: разные системы, с разной архитектурой и разной манерой объяснять свой выбор, пришли примерно к одному и тому же результату: уверенно сформировали шорт-лист, который почти не совпадает с исходным запросом.

Именно поэтому данный эксперимент интересен: на узком B2B-запросе ИИ может звучать уверенно, даже когда его рекомендации почти полностью расходятся с реальным положением дел в профессиональной нише.

На первом этапе можно было бы ограничиться выводом, что «нейросети пока плохо рекомендуют подрядчиков в узких нишах». Но сухая статистика — это, отправная точка. Важно не только то, что модели ошиблись, но и как именно они это делали. Потому что дальше станет видно, что типы сбоев повторяются.

Когда я начал разбирать ответы, стало видно, что модели ошибаются не хаотично, а по повторяемым сценариям.

Самый показательный пример — DeepSeek. В ответ на запрос о студии дизайна коммерческих интерьеров, а именно офисов в Петербурге, модель выдала список архитектурных бюро: Apex, UNK project, Za bor architects, Studio 44, «Мастерская Мамошина». Ответ звучал солидно, с упором на масштаб, узнаваемость и профессиональный вес. Но после проверки оказалось, что модель искала не тех, кто системно работает с офисными интерьерами, а тех, кто выглядит статусно в широком архитектурном поле, без проверки доли офисных дизайн-проектов в их портфолио.

То есть проблема была не в том, что архитектурные бюро «не подходят» для офисов, а в том, что модель не удержала предмет запроса — устойчивую офисную специализацию.

ИИ собирал топ дизайн-студий так, будто офис, жилье, рестораны и общественные пространства относятся к одной категории. Это особенно хорошо видно в ответах ChatGPT и Gemini:

ChatGPT поставил в один список Studio 44, Studia 54, DKING, «Студию Ольги Мудряковой», Artum, Radical Design Studio, хотя по факту там перемешались архитектурные бюро, частные дизайнеры, студии, которые занимаются жилыми пространствами, и только одно более-менее близкое к запросу бюро.
Gemini сделал похожий ход: в его списке оказались DA bureau, известное прежде всего ресторанными и общественными проектами, Студия Павла Полынова с широким профилем, LINES Design и METAarchitects.

Во всех случаях модель не отделяла офис как продукт от студии дизайна коммерческих интерьеров.

Запрос был не просто про студию офисов, а про студию в Санкт-Петербурге. Но модели периодически вели себя так, как будто география вторична:

Яндекс Алиса включила в список Vitta Group, хотя в массиве проверки эта студия всплывает как игрок из Симферополя, а не из Петербурга.
Gemini не маркировал разницу между локальными петербургскими студиями и сильными внешними бюро, как будто сам факт работы с коммерческими интерьерами уже достаточен, чтобы пройти географический фильтр запроса.

Даже когда модель называла профессионально сильных игроков, она часто не проверяла, соответствуют ли они самому простому условию — поиску студии именно в Петербурге.

Изначально почти все модели говорили уверенно и подробно. Но затем я попросил объяснить, почему выбрали эти студии и на какие сайты опирались.

ChatGPT сначала рассказывал, что ориентировался на реальные офисные кейсы, архитектурное мышление и адекватный клиентский опыт, а затем признавал, что использует не только профессиональные медиа, но и карты, агрегаторы отзывов, а иногда даже площадки вроде YouDo и Avito как вспомогательные сигналы.

Вверху представлен пример ответа <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">ChatGPT</a>. Все скрины ответов для ознакомления <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">здесь</a>.

DeepSeek честно уточнил, что не анализировал сайты в реальном времени и работал по обобщенной базе знаний.

GigaChat, наоборот, так и не смог перейти от общих категорий источников к конкретике.

Вверху представлен пример ответа GigaChat. Все <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">скрины </a>ответов для ознакомления <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">здесь</a>.

Gemini производил впечатление того, что всё глубоко проверил, но при перечислении источников смешивал Officenext с VC, DTF, Klerk и другими площадками, которые не образуют единый профессиональный контур.

Вверху представлен пример ответа Gemini. Все <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">скрины </a>ответов для ознакомления <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">здесь</a>.

Яндекс Алиса сначала выдала подробный и логично звучащий список студий с аргументацией, будто он основан на реальном анализе (награды, опыт, BIM, отзывы и т. д.). Но когда её спросили про источники, она показала случайные и нерелевантные (например, отзывы сотрудников вместо клиентов), кроме того закрались противоречия (студия из Симферополя в подборке для Петербурга), а часть аргументов (награды, сотрудничество, рейтинги) не подтверждалась реальными данными.

Вверху представлен пример ответа Яндекс Алиса. Все <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">скрины </a>ответов для ознакомления <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fd%2F1R6NA3eAb9JsnjA9lYTTLmrYs-x7eJKE8CJYedNDUSos%2Fedit%3Fusp%3Dsharing&amp%3BpostId=2921241&postId=2921241" rel="nofollow noreferrer noopener" target="_blank">здесь</a>.

То есть по мере уточнения запроса «экспертность» моделей всё чаще оказывалась либо агрегированным шумом, либо красиво оформленной неопределенностью.

Все четыре типа ошибок показывают, что проблема не в «плохих студиях» и не в том, что модель случайно вспомнила не тех игроков. А в том, что ИИ системно путает тип экспертизы, сегмент, географию и качество сигнала, на который опирается.

Теперь, когда зафиксированы типы ошибок, пора задать главный вопрос: какие внутренние правила заставляют модель раз за разом выбирать цифровой шум вместо профильной экспертизы?

ИИ используют упрощенные правила отбора — эвристики, которые вполне работают в массовом B2C-поиске, но начинают ломаться, когда сталкиваются с узким профессиональным рынком.

Эвристики — это быстрая числовая оценка варианта, которая говорит алгоритму: «Проверяй это в первую очередь, оно выглядит лучше». Без нее пришлось бы перебирать всё подряд.

Именно определенный набор эвристик — повторяемость, универсальность, цифровая доступность и рейтинги дизайн-студий как прокси доверия — уже просматривается в самом исследовании.

Для модели часто упоминаемое выглядит более надежным. Если название всплывает в картах, подборках, отзывах, медиа и рейтингах дизайн-студий, значит, этому можно доверять. В массовом поиске такая логика еще может давать приемлемый результат: если кафе, клиника или салон часто встречаются в локальном цифровом контуре, это хотя бы что-то говорит о заметности и спросе. Но в B2B эта логика дает искажение.

Экспертный консенсус формируют не агрегаторы и SEO-каталоги, а повторяемость сложных проектов, рекомендации внутри профессионального сообщества, премии, шорт-листы и деловая репутация. ИИ почти не различает эти уровни. Он видит не «кого выбирают на рынке», а «кто чаще встречается в доступных и вызывающих доверие источниках» — ИИ чаще смотрит на источники, которые оптимизированы с учетом SEO и находятся в топе поисковых систем.

Узкая специализация для модели сложнее, чем широкий профиль. Студия, которая делает всё — квартиры, рестораны, офисы, общественные пространства, — выглядит более устойчивым и непротиворечивым кандидатом, чем бюро, заточенное под один тип задач. Просто потому что универсальная студия чаще упоминается в самых разных контекстах — от жилых интерьеров до общественных пространств, и ее имя всплывает в большем количестве источников.

Для человека это часто наоборот: чем уже специализация, тем выше шанс, что подрядчик глубже понимает конкретный тип объекта. Но модель стремится к безопасной, широкой категории, потому что она лучше подтверждается цифровым следом. В результате вместо студии дизайна коммерческих интерьеров в шорт-лист попадают те, кто просто присутствует в большом поле «дизайна интерьеров».

Модель лучше считывает то, что хорошо структурировано, размечено и повторяется в интернете. Реальная B2B-экспертиза часто устроена наоборот. Крупные офисные кейсы могут быть под NDA. Самые сильные проекты нередко плохо визуализируются в открытом доступе.

Сайты студий дизайна коммерческих интерьеров порой не размечают кейсы по типу объекта так, чтобы это было понятно машине. Именно поэтому в ответах моделей так часто всплывали студии с богатыми сайтами, активными соцсетями и множеством публикаций в интерьерных или lifestyle-медиа, а не те, чья экспертиза подтверждается закрытыми корпоративными кейсами и повторяемостью в профессиональной среде. В итоге побеждает не тот, у кого глубже экспертиза, а тот, чья экспертиза легче превращается в машиночитаемый сигнал.

Для B2C рейтинг на картах или поток отзывов действительно могут быть полезным фильтром. Но в узкой B2B-нише высокий рейтинг в Яндекс Картах почти ничего не говорит о том, умеет ли студия проектировать рабочую среду, разбираться в сценариях офисной жизни, учитывать ГОСТы и пожарную безопасность, работать с корпоративными заказчиками и доводить сложный объект до реализации. Ведь работать с бригадой, которая занимается квартирами, — одно, а со студией дизайна коммерческих интерьеров, которая специализируется на офисах, — другое.

Тем не менее для модели такие сигналы очень соблазнительны: они простые, многочисленные и легко сравнимые. Поэтому ИИ так охотно опирается на агрегаторы и локальные карточки компаний, даже когда задача требует совсем другого класса доказательств. Это видно и в нашем разборе: там, где должны были работать профессиональные контуры, в ответах всплывали карты, отзывы и общие рейтинги дизайн-студий.

Именно в этом месте становится понятно, почему ответы моделей выглядели такими уверенными. Они следовали логике, которая вшита в их способ работы с интернетом. Проблема в том, что эта логика лучше приспособлена к массовым услугам, чем к узкой профессиональной экспертизе.

После разбора эвристик становится видно, что модель ошибается не только из-за внутренней логики отбора, но и из-за самого материала, с которым работает. Для ИИ «рынок» — это не профессиональное сообщество, а смесь источников разного качества, глубины и назначения. В исследовании это видно: модели называли и ArchDaily, и Archi.ru, и профильные премии, и одновременно — карты, Zoon, Yell, DreamJob, VC, DTF, Klerk и другие площадки, которые не образуют единый профессиональный контур.

Чтобы не сваливать всё в кучу, такой набор источников полезно разделить на три слоя.

Первый — профильный контур. Это источники, которые помогают понять рынок офисных и общественно-деловых пространств: специализированные офисные и архитектурные медиа, отраслевые премии, шорт-листы, сайты бюро с подтвержденным офисным портфелем, профессиональные кейсы. В моем исследовании к этому контуру относились Best Office Awards от Officenext, Archi.ru, ArchDaily, Project Russia, ADD Awards и аналогичные площадки. Они не гарантируют идеальную рекомендацию, но работают с рынком.

Второй — квазипрофильный контур. Это интерьерные медиа, lifestyle-издания, дизайн-платформы и портфолио-сайты вроде AD, Salon, Interior.ru, Design Mate, Behance, соцсети студий — всё это может помогать увидеть стиль, медийность и культурный контекст, но почти не помогает ответить на вопрос, кто системно работает с офисами как с отдельной профессиональной дисциплиной. Именно на этом слое модель путает офисы, рестораны, апарт-отели, жилые интерьеры и в целом дизайн коммерческих интерьеров.

Третий — цифровой шум. Это карты, агрегаторы отзывов, общие рейтинги дизайн-студий, каталоги «всех дизайнеров подряд», городские подборки и сервисные платформы вроде YouDo, Profi или Avito. Такие источники помогают проверить адрес, часы работы, количество отзывов, базовую заметность компании. Но почти ничего не говорят о глубине офисной экспертизы. Тем не менее модель на них ориентируется, потому что они легко читаются, массово повторяются и дают иллюзию количественной надежности.

В итоге разница между моделями в пропорции этих слоев:

ChatGPT оказался ближе всех к архитектурно-профессиональному контуру, но всё равно смешивал профильные варианты с интерьерными медиа, картами, отзывами и вспомогательными площадками.
DeepSeek лучше других воспроизводил архитектурное поле, но именно поэтому часто тянул в выдачу архитектурные бюро, а не студии с более узкой офисной специализацией.
Gemini создавал иллюзию глубины за счет большого числа названных источников, но внутри этого списка спокойно соседствовали Officenext, Best Office Awards, VC, DTF и Klerk.
Яндекс Алиса почти полностью жила в слое локальной видимости и отзывов, поэтому ее рекомендации оказались ближе к расширенному справочнику, чем к профессиональному анализу.
GigaChat вообще не смог прозрачно показать, на чем строится его картина рынка.

Если посмотреть на ответы моделей под этим углом, становится видна закономерность: чем выше доля непрофильных источников, тем дальше итоговый список от реального рынка.

Чтобы не повторять ошибку нейросетей, я не собирал собственный список, опираясь на информацию из интернета, карт и агрегаторов отзывов. Я взял более узкую и проверяемую выборку — номинантов Best Office Awards SPb 2024–2025 на Officenext. Затем оставил только офисные, сервисно-офисные и коворкинговые проекты, разделил студии на локальные и внешние бюро, которые работают в петербургском контуре, но не базируются в городе.

Внутри выборки смотрел на четыре момента:

Есть ли у бюро офисные проекты в Петербурге.
Понятно ли с первого взгляда, что бюро работает именно с офисами.
Есть ли один или несколько релевантных проектов за 2024–2025 год.
Насколько устойчивая специализация: офисы в портфолио — единичный проект или есть серия похожих кейсов.

То есть я ориентировался на списки номинантов в Best Office Awards SPb 2024–2025 на Officenext, официальные сайты студий и их публичное позиционирование.

По этой методике у меня получился такой рейтинг дизайн-студий.

Designic. Есть офис в Санкт-Петербурге на Малом проспекте Петроградской стороны, 5Б, на официальном сайте выделены офисы и деловые пространства, а в номинантском контуре 2024 года сразу два релевантных проекта — Kazanskaya PAGE и Qvant. Designic попадает под три нужных критерия — локальность, понятную специализацию и повторяемость кейсов.
Hubarch. Студия находится в Петербурге, в открытых источниках за 2024 год здесь у них числится два проекта — Solopharm и «Практик Чехова», а в собственном портфолио есть и более ранние петербургские проекты вроде «Практик Гороховая» и «Проспект». У бюро есть серия проектов одного типа в городе.
BRIZ Studio. Есть петербургский адрес, а в профильном контуре студия появляется два года подряд: в 2024 году с проектом «ВКонтакте», в 2025 году — с «Авиасейлс». Даже если смотреть только на открытые и проверяемые сигналы, этого уже достаточно, чтобы считать BRIZ устойчивым локальным игроком в офисном сегменте.
AIKIdesign. В открытом доступе у студии несколько релевантных петербургских проектов — Benua Campus Page, Park Page и офис продаж «Скороход» в списке 2024 года, на собственном сайте есть и внешние офисные кейсы, например офис «Деловые линии». Кроме того, они находятся в Петербурге.
Radical Design. Есть офис в Петербурге, в 2024 году фигурируют несколько проектов: Bell integrator, U-Apart и «Невская базилика», а в 2025 году — Aurix. Это заметный игрок внутри выборки. Но в публичном поле выглядит менее сфокусированным, чем Designic, менее серийным, чем Hubarch, и менее устойчивым по повторяемости сигналов, чем BRIZ.

Внешние (из других городов):

OFFCON. У бюро московская база, но в открытом контуре можно найти проект «Школа Яндекса» в 2024 году и «Т-Технологии» — в 2025. Это не случайное присутствие, а повторяемый внешний сигнал в нужной географии.
UNK corporate interiors. В профиле компании на Officenext сказано, что бюро занимается дизайном корпоративных интерьеров, а в петербургском контуре за 2024 год есть проект «ЭР-Телеком». Здесь важна чистота совпадения с запросом «корпоративные интерьеры плюс подтвержденный кейс в Петербурге».
'nefa'architects'. Заметный офисный профиль и два петербургских проекта «Яндекса» в контуре за 2025 год. Есть специализация, повторяемый сигнал и прямое присутствие в локальном профессиональном контуре.
IND. В контуре 2025 года у бюро есть петербургский проект «Многопрофильная компания», а в открытом позиционировании студия считывается как бюро с сильной офисной практикой. Попадает во внешнюю группу не как «самое крупное по цифрам», а как релевантный игрок с подтвержденным проектом в Петербурге и понятным офисным профилем.

Главный смысл этой выборки такой: если убрать агрегаторный шум и смотреть только на открытый профильный контур, список становится жестче и понятнее. В нем остаются не самые громкие по цифровому следу, а те, у кого есть проверяемые основания для попадания в ответ на исходный запрос: офисная специализация, локальность или подтвержденная работа в Петербурге, повторяемость и присутствие в профессиональной среде.

Мой эксперимент показал, что общий запрос без дополнительных фильтров слишком легко превращается в список заметных по цифрам, а не профессионально релевантных игроков: 35 рекомендаций, одно условное попадание. Поскольку модели системно путают сегменты, игнорируют географию и смешивают профессиональные сигналы с цифровым SEO и поведенческим шумом, уточнение этих параметров в запросе резко сужает поле для ошибки.

Если все-таки использовать ИИ в прикладной работе, формулировать запрос нужно еще конкретнее. Не «порекомендуй хорошую студию», а, например, «Найди студии с офисными проектами в Санкт-Петербурге, у которых есть подтвержденные кейсы в профильных шорт-листах за последние два года». Чем ближе запрос к проверяемым признакам — тип объекта, город, масштаб, награды, публикации, — тем меньше пространства для цифрового шума и выше шанс получить полезный список. Это напрямую следует из всей логики эксперимента: модели лучше справляются тогда, когда им труднее перепутать сигналы разного класса.

И также не стоит доверять первому красивому списку и думать, что уверенный тон равен качественной рекомендации. На узком рынке ИИ сегодня он скорее помогает начать поиск, чем завершить его.

Для студий вывод можно сделать такой: на рынке уже недостаточно просто быть сильным игроком. Нужно, чтобы эта сила читалась без участия человека. Нужно делать специализацию машиночитаемой:

явно размечать кейсы по типу объекта,
не прятать офисные проекты в общий поток «дизайна коммерческих интерьеров»,
показывать географию,
фиксировать участие в профильных премиях и не рассчитывать, что сильная репутация «сама как-нибудь считается».

Например, вместо расплывчатого «Коммерческий интерьер в бизнес-центре» лучше писать «Офис IT-компании, 500 м², Санкт-Петербург, 2024». Во втором случае и человеку, и машине намного легче понять, что перед ними не абстрактный кейс, а конкретный маркер специализации.

Но прежде чем ставить точку, важно честно обозначить границы самого эксперимента — что он действительно доказывает, а что остается за его рамками.

У исследования есть границы. Я тестировал один тип естественного запроса — общий, разговорный, без уточнения бюджета, площади, стилистики, сроков и других параметров, которые обычно появляются уже на более позднем этапе выбора подрядчика. Я сделал это намерено, чтобы проверить не идеальный сценарий с длинным брифом, а самый типичный пользовательский заход в ИИ-ассистент.

Кроме того, я анализировал первый уровень рекомендаций, а не результат глубокого многошагового диалога. Теоретически модель могла бы улучшить список после серии уточняющих вопросов. Но именно первый ответ в таких системах чаще всего и работает как стартовая точка для дальнейшего выбора. Поэтому для целей этого материала было важно проверить, что происходит именно на входе.

Есть и еще одно ограничение: исследование касается одной профессиональной ниши — дизайна офисов и коммерческих интерьеров — и одного города — Санкт-Петербурга. Из этого нельзя автоматически делать вывод, что любая рекомендация ИИ в любой B2B-категории будет такой же слабой. Но можно сделать более аккуратный вывод: в нишах, где экспертный рынок плохо переводится в машиночитаемый контур, риск нерелевантной выдачи заметно выше.

Наконец, ответы моделей меняются со временем. Я проводил этот эксперимент в феврале-марте 2026 года, в будущем часть формулировок, логики или даже списков источников у моделей может измениться. Но для материала важна не только конкретная дата теста, а то, что на момент проверки разные системы воспроизвели один и тот же тип сбоя: уверенную рекомендацию при слабом соответствии исходному запросу. Именно повторяемость этого сбоя в разных системах делает эксперимент показательным, несмотря на его локальность.

Эксперимент важен потому, что на простом и естественном запросе — «Порекомендуй хорошую студию дизайна офисов в Санкт-Петербурге» — разные ИИ-системы почти синхронно показали одну и ту же картину рынка. И эта картина оказалась очень далека от реальной профессиональной структуры. Тот самый простой вопрос, с которого всё началось, оказался для моделей тестом на умение собирать цифровой шум.

В этом смысле ИИ отразил скорее цифровую оболочку рынка: то, что лучше всего индексируется, чаще всего повторяется и легче всего превращается в машиночитаемый сигнал. Именно поэтому главный вывод этой статьи не сводится к фразе «ИИ пока не умеет рекомендовать подрядчиков». Умеет — но по тем правилам, которые встроены в публичный интернет.

Сегодня при работе с ИИ выигрывает тот, чье присутствие лучше размечено и чаще встречается в доступных источниках. Поэтому человеку всё еще обязательно нужно проверять рекомендации нейросети, а бизнесу — описывать, маркировать и связывать свою работу с доказательствами так, чтобы она была понятна не только человеку, но и машине.

Нейросети и узкие запросы: как я искал и выбирал дизайн-студию офиса с помощью ИИ и ничего не нашел

Какие нейросети выбрал для анализа: запрос и ответы модели

Анатомия ошибок: не одна, а несколько повторяющихся типов сбоев

Ошибка: подмена узкой офисной экспертизы более широким архитектурным полем

Ошибка: смешение сегментов

Ошибка: игнорирование локальности

Ошибка: иллюзия аргументации и источников

Почему ИИ ошибается: эвристики, которые ломаются на узком B2B-рынке

Первая эвристика: повторяемость

Вторая эвристика: универсальность

Третья эвристика: цифровая доступность

Четвертая эвристика: рейтинги дизайн-студий и отзывы

Что ИИ считает рынком: источники, которые формируют цифровой шум

Нейросети vs ручной отбор: кто отвечает на запрос о студии дизайна офисов в Петербурге

Рейтинг дизайн-студий офиса в Санкт-Петербурге

Что это значит для бизнеса и для студий

Ограничения эксперимента

Заключение