Что на самом деле показал NVIDIA State of AI 2026?
NVIDIA State of AI 2026 вышел на неделе с цифрой, которая звучит как анонс победы. 87% крупных компаний говорят, что снизили cost-per-task на AI-workflows. Четверть из них срезала расходы больше чем на 10% год к году. Потом идут имена: Walmart, 75 миллионов на supply-chain. Fujitsu, 15 миллионов на customer-service. JPMorgan, 360 тысяч человеко-часов в год на переработке контрактов.
Цифра красивая. Но внутри неё зашит нюанс, который надо видеть. NVIDIA опрашивала F500. Ответы давали те же F500. Никто снаружи не проверял: может, это правда или может, компании считают иначе. Те, кому удалось внедрить AI, мотивированы цифру преувеличить. Те, у кого ничего не вышло, молчат. Короче говоря завышены ли результаты?
Что компании на самом деле считали
Walmart, $75M на supply-chain. Это склад и доставка. AI помогла лучше предсказывать спрос, и от этого меньше переполненных складов, меньше дефицит. Каждый процент точности — живые деньги. На компании с доходом $650 млрд это 0,01% выручки, но для supply-chain это хороший результат.
Вопрос: повторится ли это завтра? Это был happy year или система правда работает? И главное — сколько стоило обучение и настройка модели? (Ставлю деньги, что не включено в 75 миллионов.)
Если копать глубже: Walmart обычно не публикует детали своих систем. Известно, что они работают на собственных закрытых платформах. AI внедрили не один раз, но это был случай, когда смогли четко измерить результат в денежном выражении. Вероятно, внедрили в одну из ветвей логистики, где метрики были прозрачны. Сложная часть: вся их цепь требует согласованности, переучивание модели при смене сезонности может занять недели, и вот тогда экономия может исчезнуть. Этого мы не знаем.
Fujitsu, $15M на customer-service. Чаты с клиентами переселили на chatbot, люди теперь только на сложные случаи. 15 миллионов — это зарплаты операторов, которых сократили. Экономия очевидна. Цена вопроса: стал ли сервис лучше или просто дешевле? (Дешевле. Это логично для компании, но важно это знать.)
Что скрыто: на каких данных обучили? Как часто переучивают? Кто проверяет ошибки модели и это включено в стоимость? (Обычно включено, но никто об этом не кричит.) Fujitsu обслуживает корпоративных клиентов, для них качество важнее цены. Если они решились на chatbot, значит, либо пилотировали на малорисковых сегментах, либо поставили систему контроля качества. Обе опции добавляют к стоимости. К стоимости, которую они не упоминают.
JPMorgan, 360k часов на контракты. Юристы читали контракты вручную, вытаскивали клаузулы, проверяли риски. Теперь первый шаг делает AI, юристы только проверяют. 360 тысяч человеко-часов — это реальные деньги. Но каких часов? Junior-ассоциантов или опытных партнёров? Разница в стоимости часа — порядок величины, и она меняет финальную экономию принципиально. JPMorgan молчит.
Что мы не видим: качество улучшилось или просто скорость выросла, а ошибки остались на том же уровне (но никто не проверяет так же внимательно)? JPMorgan — крупнейший инвестиционный банк, для них ошибка в контракте может стоить миллионы. Если они заявляют об экономии часов, это означает, что система точна и что есть многоуровневая проверка. Это добавляет стоимость, которой нет в отчёте.
Так что в реальности?
Типичный сценарий: запустили пилот, внедрили AI-систему, никто не зафиксировал исходные метрики. Полгода спустя: система работает, но в каких числах улучшение? Никаких. Руководство на совещании: «Так мы сэкономили или нет?» Ответ: «Вроде да, но не могу показать». Проект закрывают. Не потому что AI плохой. Потому что в следующем бюджетном цикле нет цифры для защиты, и никто не будет его финансировать.
Это не техническая ошибка. Это управленческая. Но она убивает реальные инвестиции.
Вот как это выглядит со стороны: компания запускает AI-пилот, нанимает консультантов, потом в течение квартала внедряет систему. Люди начинают её использовать. Система работает (или работает вроде), но никто не видит картинки: были ли ошибки раньше, есть ли сейчас? Было ли понимание того, сколько часов людей мы экономим? На деле часто получается: людей всё ещё столько же, они просто переползли на другую работу. Или ушли в декрет/новую работу, и никто не нанял замену. Экономия выглядит на бумаге, но в реальности это просто текучка.
Пять метрик для baseline (до запуска)
Не консалтинг. Просто действия, которые на 80% решают проблему.
Что мерить на входе и на выходе
Начни с трёх метрик про сам процесс.
Время на задачу: не сколько минут абстрактно, а как часто люди её делают и долго ли это занимает реально. Если задача длится 2 часа раз в неделю, то недельный объём — 2 часа на человека. Если AI сократит до 30 минут, выигрыш в неделю — полтора часа на человека. На десятерых — 15 часов в неделю, или 0,5 FTE. Численно, внятно, считаемо.
Важный подводный камень: если после сокращения времени сотрудник не уволен, а переложен на другую работу, на бумаге вы видите X часов экономии, но в денежном эквиваленте её нет. Освобождённое время становится capacity, не деньгами. Для защиты бюджета важно это различие понимать заранее.
Второе — процент ошибок или переделок. Из 100 задач сколько люди переделают, исправят или пометят как неправильные? Для юристов это может быть 5%, для customer-service 20%. Запиши эту базовую цифру. После внедрения AI повторяешь тест на той же датасет, той же выборке. Упала ли процентовка? Вот метрика. Тонкость: ошибка AI часто отличается от ошибки человека. Человек может забыть важную клаузулу, AI может выдать неправильный результат на экзотических комбинациях условий, которых не было в обучающих данных. После внедрения ты можешь обнаружить, что процент ошибок не упал, просто ошибки стали другого типа. Для рисков это может быть хуже.
Третье — скорость цикла от начала к завершению. От поступления задачи к готовому результату сколько часов? (Не обработка машиной, а стена-к-стене.) До AI: 4 часа. После AI: машина 0,5 часа + человек на проверку 1,5 часа = 2 часа. Это 2x экономия, не 8x, как выглядит на бумаге. Кажется мелочью, но это критично. Когда люди говорят об ускорении в 10x, они имеют в виду обработку информации машиной. На деле, если вмешивается человек, который проверяет работу, цифра скромнее. Но надо это знать, когда планируешь ROI.
Что мерить в деньгах и в устойчивости
Четвёртое — стоимость единицы, честная. Обработка одной задачи сейчас стоит X: это зарплата человека за время работы + операционные расходы. Раньше: $5. С AI: $0.50 на токены + $1 на человека-проверяющего = $1.50. Экономия: $3.50, или 70%. Честная цифра, потому что включает проверку. Вот здесь часто врут. Компания видит стоимость токена ($0.50) и думает, что это полная стоимость. Но проверка — это человек, который потратил время. И если этого человека нет сейчас, его надо будет нанять. Это не экономия, это переквалификация задачи.
Пятое — скорость адаптации при смене правил. AI обучена на исторических данных. Когда наступает новое (новый закон, новая версия продукта, новый процесс в компании), как быстро модель переучится? Человек адаптируется за часы, AI часто требует дни или недели переобучения — особенно если новый класс входа редкий в исходных данных. На время переобучения задачи копятся, цикл растягивается. Надо это знать ДО запуска пилота, потому что в некоторых процессах такая задержка может быть крупнее, чем исходная экономия времени.
Где в отчёте NVIDIA белые пятна
Self-report bias. Успешные пилоты о себе рассказывают охотно. Неудачные молчат. Выборка смещена в сторону успехов на 15-20%. Это означает, что реальная цифра 70%, не 87%.
Если быть строгим, то даже 70% может быть завышено. Потому что самоотчёт про экономию обычно включает только яркие цифры — время и зарплаты. Никто не добавляет в расчёт потайные расходы: переучивание, поддержку, обновление модели, мониторинг качества. Если добавить все расходы, то 70% может сократиться до 50%.
Отсутствие разбора по отраслям и размерам. 87% может быть распределено так: 95% в финтехе, 70% в розничной торговле, 45% в производстве. Для вашей отрасли цифра может быть принципиально другой. Но NVIDIA это не раскрывает.
Нет разделения по типам AI. Полностью автоматизирующий агент даёт 80% экономии. Copilot, который подсказывает человеку, даёт 30%. Простой скрипт на Python даёт 20%. NVIDIA их складывает вместе в одну 87%.
Нет контрольной группы. Компании не сравниваются с alternative: если бы они улучшали процесс БЕЗ AI (нанимали лучших людей, переучивали команду, меняли систему). Может быть, от AI реальный прирост 5%, а остальные 15% — от организационных изменений. Мы этого не видим.
Это критичный момент. Когда компания говорит «мы сэкономили $10M с помощью AI», она может забыть (или не хотеть помнить) что они одновременно нанимали новых людей на другие роли, меняли процесс работы, нанимали консультантов. Какую часть экономии дал каждый из факторов? Неизвестно.
Что делать перед следующим пилотом
Перед запуском потратьте две недели на пять вопросов. Не две недели работы специалиста. Две недели на встречу с людьми, которые делают задачу, и одну таблицу.
— как долго задача занимает сейчас (в часах или минутах);
— как часто её делают (в неделю или месяц); — сколько стоит один цикл (зарплата человека за это время);
— какой процент результатов требуют доработки или переделки;
— какой риск, если AI ошибётся (и кто за это заплатит).
Запишите в таблицу. Это ваш baseline. Через три месяца работы с AI повторите измерения. Сравните. Готово.
Те 87%, которые попали в цифру NVIDIA, почти наверняка делали это или близко к этому. Остальные надеялись на везение. И не факт что им повезло.
Больше разборов AI для бизнеса - в Telegram: Telegram