ИИ-экономика: где деньги, GPTовски?
«Чего? Ско-о-олько?!» — эти вопросы знакомы каждому, кто пытался интегрировать AI в свой продукт или бизнес-процессы через API. 70% компаний, запустивших ИИ-проекты, значительно превышают свой изначальный бюджет, а 42% вообще отказались от ИИ-инициатив в 2025 году.
Токены, «запросы», скрытые надбавки — сплошной маркетинговый туман. Нам тоже пришлось в нем поблуждать: стояла задача выбрать AI-провайдера с API для интеграции в наше приложение-планировщик SingularityApp. Искали того, кто предоставит не только мощные языковые модели, но и максимально прозрачное ценообразование.
О чем речь: В SingularityApp мы интегрировали ИИ-помощника, который помогает декомпозировать задачи, генерировать идеи для проектов и превращать хаотичные мысли в структурированные планы. Подробнее о том, на что способен наш AI-ассистент, рассказывали в отдельной статье.
Теперь делимся инсайтами, почему качественный ИИ не может стоить дешево и как не попасть на деньги при его внедрении.
Что такое токены и почему за них надо платить
Все ценообразование в AI крутится вокруг токенов — единиц измерения текста для нейросетей. Работает это так: пользователь пишет «продуктивность», но нейросеть видит не слово целиком, а набор слогов или токенов — «прод-укт-ивн-ость». В среднем 1 токен = 4 символам. Так что общаться с ИИ на английском получается выгоднее, чем на русском: наши слова длиннее, поэтому «съедают» больше токенов.
Дальше начинается самое интересное — ценовой разброс. Возьмем, к примеру, простую задачу: написать email из 200 слов. GPT-4o-mini от OpenAI попросит за такую работу $0,0002/токен, а топовая o3-mini от них же — уже $0,0015/токен. Разница в 7,5 раз за одну и ту же задачу! Почему?
Потому что «умные» модели «кушают» больше вычислительных ресурсов. Это как разница между «Ладой» и Mercedes-Benz — оба довезут, но возможности и комфорт несопоставимы. С кратким пересказом статьи справится и дешевая модель. Написать техническое задание на основе хаотичных пожеланий клиента? Тут уже нужна дорогая, и то не факт, что результат вас устроит.
Но главная засада в другом: никто толком не объясняет что почем в понятных единицах. Вот «1 млн токенов» звучит очень даже солидно, а на практике это всего лишь:
- 1500 страниц текста на английском языке;
- 2-3 часа активной работы с чатом;
- расшифровка одного часового видео.
То есть если планируете серьезно использовать AI для бизнеса, миллион токенов улетит быстрее, чем вы успеете сказать «искусственный интеллект».
Три способа «вытрясти» деньги из клиента
Окей, с токенами разобрались. Теперь посмотрим, какие схемы монетизации придумали AI-провайдеры. Всего их три: одна — прозрачная, а вот к остальным есть вопросики.
- Прямая продажа токенов
Самая честная схема а-ля Cursor: покупаешь токены по фиксированной цене (API + маржа провайдера), потом тратишь на запросы. Из плюсов — видишь баланс, контролируешь расход.
Из минусов — нужно разбираться: в тарифах на входящие и исходящие токены, зоопарке языковых моделей, расценках на дополнительные операции вроде веб-запросов. «Хитрожопый» запросный биллинг
Тут вместо токенов клиенту продают «запросы»: например, «100 запросов за $10». Понятно и просто, но дьявол, как обычно, в мелком шрифте: «сложный запрос может считаться за 3 обычных». В итоге из обещанных 100 реально получаешь 30-40 запросов.
Плюс при высокой нагрузке ИИ начинает «притормаживать». Хочешь быстрее? Покупай «бусты» за отдельные деньги (привет, Copilot от Microsoft!).
Подписочная воронка
Подписываешься за «ну, вроде норм» $20/месяц. Подсаживаешься, начинаешь активно пользоваться, и тут — бац! — «вы исчерпали лимит, подождите 5 часов или купите Pro за $100».
Дальше по нарастающей:
— ой, а у Pro-тарифа тоже есть лимиты (просто повыше);
— но мы вводим SuperProMax х10 — все большое и много за $200;
— у-у, проклятые вайб-кодеры — пришлось ввести ограничения, но есть тут у нас тариф EliteProMax за $500…
Какой подход выгоднее для конечного пользователя? Однозначно — токены. Никаких скрытых «запросов по 3 за один» и внезапных замедлений — платишь только за потребленные ресурсы. Да, для контроля расходов на ИИ придется разобраться, потратить время и изучить тарифы, но зато вы получите максимум прозрачности.
Во всем виноваты жадные провайдеры? Спойлер: нет!
Казалось бы, все понятно — злые ИИ-провайдеры устанавливают злые ИИ-цены. Но суровая реальность индустрии такова, что из-за нынешних технологических ограничений мощные нейросети просто не могут стоить дешево.
Вот из чего складываются затраты:
- железо — чтобы нейросеть отвечала быстро, нужны специальные процессоры (например, видеокарты NVIDIA H100 стоимостью как новый китайский внедорожник), а для обучения крупных языковых моделей требуются тысячи таких карт;
электричество — дата-центр с нейросетями потребляет электричества как небольшой город — 500 киловатт в час. Это $1000+ в день только за свет. А если дата-центр еще и в какой-нибудь Калифорнии находится — умножайте на два;
обучение моделей — чтобы создать GPT-4, OpenAI потратила больше миллиарда долларов (тут дружно не смотрим в сторону DeepSeek). И это без учета зарплат сотням инженеров, датасетчиков и ИИ-тренеров. Кстати, отбить эти деньги нужно до того, как выйдет следующая версия;
налоги, трансграничные платежи, банки — из каждого доллара, уплаченного пользователем, $0,60 уходит государству и финансовым посредникам. Оставшиеся $0,40 делим на 2: $0,20 — провайдеру нейросети, $0,20 — на развитие сервиса.
В общем, пока не появится железо, способное свободно запускать топовые языковые модели на обычном смартфоне, качественный ИИ останется дорогим. А без наценки в 4-5 раз от стоимости AI-провайдера любая компания, использующая его услуги для своего продукта, просто разорится.
Как бизнесу не попасть на деньги и нервные клетки
ИИ стоит денег, и с этим придется смириться. Но смириться не значит переплачивать сверх разумного. Ниже собрали несколько практических советов для экономии и душевного спокойствия.
Ставьте лимиты трат и мониторьте все дополнительные списания
Пример: пользователь Reddit получил счет от Azure OpenAI на $163 за день, хотя «реально не использовал» сервис. Что-то работало в фоне без его ведома.
Настройте алерты на превышение дневного бюджета и следите за дополнительными функциями (веб-поиск, расширенное мышление, запуск кода).
Учитывайте надбавки из-за налогов
Пример: европейские пользователи ChatGPT Plus платят €23 вместо $20 из-за НДС. В России добавьте комиссию за конвертацию и международные платежи, а также % при оплате через «перекупов».
Не переплачивайте за мощную модель для простых задач
Исправить орфографию и поставить запятые может и дешевая нейросеть за $0,001 вместо $0,10. Используйте топовые модели только там, где они реально нужны.
Используйте «пакетный режим» со скидкой для несрочных задач
Многие AI-провайдеры позволяют использовать для анализа отчетов, перевода документов, генерации описаний и других однотипных задач специальный batch-режим со скидкой 50%. Ответ придет через пару часов. Но если задачи не горят, зачем переплачивать?
Не заключайте с ИИ-провайдерами многолетние договоры
Цены падают быстро (правда, в основном на новые модели). Пример: в 2022 GPT-3.5 стоил $20 за миллион токенов, сейчас — $0,50.
Подведем итог: да, ИИ дорогой по объективным причинам — железо, электричество и разработка стоят как космическая программа. Провайдеры добавляют к этому непрозрачные схемы монетизации, а рынок еще молодой и дикий — цены скачут, модели устаревают за полгода, условия меняются быстрее, чем успеваешь прочитать.
Все, конечно, страшно, очень страшно, но теперь вы знаете, что это такое. А для получения реальной пользы без астрономических счетов осталось только разобраться в токенной экономике и перестать вестись на маркетинговые уловки 😉