ИИ-экономика: где деньги, GPTовски?

«Чего? Ско-о-олько?!» — эти вопросы знакомы каждому, кто пытался интегрировать AI в свой продукт или бизнес-процессы через API. 70% компаний, запустивших ИИ-проекты, значительно превышают свой изначальный бюджет, а 42% вообще отказались от ИИ-инициатив в 2025 году.

ИИ-экономика: где деньги, GPTовски?

Токены, «запросы», скрытые надбавки — сплошной маркетинговый туман. Нам тоже пришлось в нем поблуждать: стояла задача выбрать AI-провайдера с API для интеграции в наше приложение-планировщик SingularityApp. Искали того, кто предоставит не только мощные языковые модели, но и максимально прозрачное ценообразование.

О чем речь: В SingularityApp мы интегрировали ИИ-помощника, который помогает декомпозировать задачи, генерировать идеи для проектов и превращать хаотичные мысли в структурированные планы. Подробнее о том, на что способен наш AI-ассистент, рассказывали в отдельной статье.

Теперь делимся инсайтами, почему качественный ИИ не может стоить дешево и как не попасть на деньги при его внедрении.

Что такое токены и почему за них надо платить

Все ценообразование в AI крутится вокруг токенов — единиц измерения текста для нейросетей. Работает это так: пользователь пишет «продуктивность», но нейросеть видит не слово целиком, а набор слогов или токенов — «прод-укт-ивн-ость». В среднем 1 токен = 4 символам. Так что общаться с ИИ на английском получается выгоднее, чем на русском: наши слова длиннее, поэтому «съедают» больше токенов.

Дальше начинается самое интересное — ценовой разброс. Возьмем, к примеру, простую задачу: написать email из 200 слов. GPT-4o-mini от OpenAI попросит за такую работу $0,0002/токен, а топовая o3-mini от них же — уже $0,0015/токен. Разница в 7,5 раз за одну и ту же задачу! Почему?

Потому что «умные» модели «кушают» больше вычислительных ресурсов. Это как разница между «Ладой» и Mercedes-Benz — оба довезут, но возможности и комфорт несопоставимы. С кратким пересказом статьи справится и дешевая модель. Написать техническое задание на основе хаотичных пожеланий клиента? Тут уже нужна дорогая, и то не факт, что результат вас устроит.

ИИ-экономика: где деньги, GPTовски?

Но главная засада в другом: никто толком не объясняет что почем в понятных единицах. Вот «1 млн токенов» звучит очень даже солидно, а на практике это всего лишь:

  • 1500 страниц текста на английском языке;
  • 2-3 часа активной работы с чатом;
  • расшифровка одного часового видео.

То есть если планируете серьезно использовать AI для бизнеса, миллион токенов улетит быстрее, чем вы успеете сказать «искусственный интеллект».

Три способа «вытрясти» деньги из клиента

Окей, с токенами разобрались. Теперь посмотрим, какие схемы монетизации придумали AI-провайдеры. Всего их три: одна — прозрачная, а вот к остальным есть вопросики.

  1. Прямая продажа токенов
    Самая честная схема а-ля Cursor: покупаешь токены по фиксированной цене (API + маржа провайдера), потом тратишь на запросы. Из плюсов — видишь баланс, контролируешь расход.

    Из минусов — нужно разбираться: в тарифах на входящие и исходящие токены, зоопарке языковых моделей, расценках на дополнительные операции вроде веб-запросов.
  2. «Хитрожопый» запросный биллинг

    Тут вместо токенов клиенту продают «запросы»: например, «100 запросов за $10». Понятно и просто, но дьявол, как обычно, в мелком шрифте: «сложный запрос может считаться за 3 обычных». В итоге из обещанных 100 реально получаешь 30-40 запросов.

    Плюс при высокой нагрузке ИИ начинает «притормаживать». Хочешь быстрее? Покупай «бусты» за отдельные деньги (привет, Copilot от Microsoft!).

  3. Подписочная воронка

    Подписываешься за «ну, вроде норм» $20/месяц. Подсаживаешься, начинаешь активно пользоваться, и тут — бац! — «вы исчерпали лимит, подождите 5 часов или купите Pro за $100».

    Дальше по нарастающей:

    — ой, а у Pro-тарифа тоже есть лимиты (просто повыше);

    — но мы вводим SuperProMax х10 — все большое и много за $200;

    — у-у, проклятые вайб-кодеры — пришлось ввести ограничения, но есть тут у нас тариф EliteProMax за $500…

Какой подход выгоднее для конечного пользователя? Однозначно — токены. Никаких скрытых «запросов по 3 за один» и внезапных замедлений — платишь только за потребленные ресурсы. Да, для контроля расходов на ИИ придется разобраться, потратить время и изучить тарифы, но зато вы получите максимум прозрачности.

ИИ-экономика: где деньги, GPTовски?

Во всем виноваты жадные провайдеры? Спойлер: нет!

Казалось бы, все понятно — злые ИИ-провайдеры устанавливают злые ИИ-цены. Но суровая реальность индустрии такова, что из-за нынешних технологических ограничений мощные нейросети просто не могут стоить дешево.

Вот из чего складываются затраты:

  • железо — чтобы нейросеть отвечала быстро, нужны специальные процессоры (например, видеокарты NVIDIA H100 стоимостью как новый китайский внедорожник), а для обучения крупных языковых моделей требуются тысячи таких карт;
ИИ-экономика: где деньги, GPTовски?
  • электричество — дата-центр с нейросетями потребляет электричества как небольшой город — 500 киловатт в час. Это $1000+ в день только за свет. А если дата-центр еще и в какой-нибудь Калифорнии находится — умножайте на два;

  • обучение моделей — чтобы создать GPT-4, OpenAI потратила больше миллиарда долларов (тут дружно не смотрим в сторону DeepSeek). И это без учета зарплат сотням инженеров, датасетчиков и ИИ-тренеров. Кстати, отбить эти деньги нужно до того, как выйдет следующая версия;

  • налоги, трансграничные платежи, банки — из каждого доллара, уплаченного пользователем, $0,60 уходит государству и финансовым посредникам. Оставшиеся $0,40 делим на 2: $0,20 — провайдеру нейросети, $0,20 — на развитие сервиса.

В общем, пока не появится железо, способное свободно запускать топовые языковые модели на обычном смартфоне, качественный ИИ останется дорогим. А без наценки в 4-5 раз от стоимости AI-провайдера любая компания, использующая его услуги для своего продукта, просто разорится.

Как бизнесу не попасть на деньги и нервные клетки

ИИ стоит денег, и с этим придется смириться. Но смириться не значит переплачивать сверх разумного. Ниже собрали несколько практических советов для экономии и душевного спокойствия.

  1. Ставьте лимиты трат и мониторьте все дополнительные списания

    Пример: пользователь Reddit получил счет от Azure OpenAI на $163 за день, хотя «реально не использовал» сервис. Что-то работало в фоне без его ведома.

    Настройте алерты на превышение дневного бюджета и следите за дополнительными функциями (веб-поиск, расширенное мышление, запуск кода).

  2. Учитывайте надбавки из-за налогов

    Пример: европейские пользователи ChatGPT Plus платят €23 вместо $20 из-за НДС. В России добавьте комиссию за конвертацию и международные платежи, а также % при оплате через «перекупов».

  3. Не переплачивайте за мощную модель для простых задач

    Исправить орфографию и поставить запятые может и дешевая нейросеть за $0,001 вместо $0,10. Используйте топовые модели только там, где они реально нужны.

  4. Используйте «пакетный режим» со скидкой для несрочных задач

    Многие AI-провайдеры позволяют использовать для анализа отчетов, перевода документов, генерации описаний и других однотипных задач специальный batch-режим со скидкой 50%. Ответ придет через пару часов. Но если задачи не горят, зачем переплачивать?

  5. Не заключайте с ИИ-провайдерами многолетние договоры

    Цены падают быстро (правда, в основном на новые модели). Пример: в 2022 GPT-3.5 стоил $20 за миллион токенов, сейчас — $0,50.

Подведем итог: да, ИИ дорогой по объективным причинам — железо, электричество и разработка стоят как космическая программа. Провайдеры добавляют к этому непрозрачные схемы монетизации, а рынок еще молодой и дикий — цены скачут, модели устаревают за полгода, условия меняются быстрее, чем успеваешь прочитать.

Все, конечно, страшно, очень страшно, но теперь вы знаете, что это такое. А для получения реальной пользы без астрономических счетов осталось только разобраться в токенной экономике и перестать вестись на маркетинговые уловки 😉

9
4 комментария