50 миллиардов токенов спустя: мой путь развития llm7.io с нуля

Дисклеймер: эту статью написал человек.

Всем привет, меня зовут Евгений. В апреле 2025 года я запустил небольшой пет-проект - llm7.io.

Изначально это вообще не задумывалось как «продукт». Я делал его под свои задачи, а заодно открыл простой chat-compatible API endpoint, через который любой желающий мог получить доступ к LLM-моделям. Одна из ключевых целей была личной: проверить свои инженерные навыки и архитектуру под реальной prod-нагрузкой.

Спустя почти семь месяцев этот «маленький эксперимент» превратился во что-то гораздо более серьёзное, чем я ожидал.

За это время llm7.io пришлось быстро повзрослеть.

Всего обработано более 50 миллиардов токенов
Около 184 миллионов запросов
Ежемесячная аудитория - примерно 56 тысяч уникальных пользователей

Сервис практически всё время работал 24/7, было меньше десяти простоев, каждый из которых я старался чинить максимально оперативно (+- несколько часов). Для одиночного пет-проекта я этим искренне горжусь. Это значит, что люди реально используют llm7.io для прототипирования идей, построения инструментов и экспериментов - и инфраструктура в целом выдерживает.

Но вместе с ростом пришли и проблемы.

В какой-то момент стало ясно: полностью безлимитный бесплатный доступ - невозможен. Не столько технически и финансово, но и по отношению к тем, кто пользуется сервисом ответственно.

В августе и сентябре сервис начал получать довольно странную нагрузку. Внешне запросы выглядели «прилично»: без мата, без очевидно вредоносного контента. Но если присмотреться, запросы были по сути бессмысленной мешаниной слов, повторяющейся по кругу - явно не реальное, или лучше сказать - осмысленное использование.

Кто-то потратил немало времени, чтобы автоматизировать отсылку мусора. Запросы приходили на верхней границе rate limit, каждую секунду, неделями подряд. Скорее всего, цель была проста: забить очередь, перегрузить систему и сделать сервис неудобным для всех остальных (если идея была «обанкротить llm7 бессмысленными запросами» — спойлер: в таком виде это не сработает).

Для меня это превратилось в своеобразную задачу:

Как сохранить llm7.io открытым и полезным для обычных пользователей, и при этом защитить его от тех, кто воспринимает «бесплатно» как «безлимитно и безответственно»?

Одних только rate limit'ов уже было недостаточно. В итоге я пришёл к довольно простому выводу: чтобы обеспечить нормальный доступ ответственным пользователям, какая-то форма платной подписки неизбежна.

Со стороны «ну давай сделаем подписку» звучит просто. На практике это затрагивает почти всё:

Аутентификацию и биллинг
Лимиты и квоты
Мониторинг и защиту от абьюза
Планирование инфраструктурных затрат
UX, документацию, поддержку и ожидания пользователей

После нескольких итераций я остановился на двух уровнях подписки, которые самому кажутся разумными: Vibe и Pro.

Цена: $5 в месяц
Примерные лимиты: до 10 текстовых запросов/сек; до 600 текстовых запросов/мин; до 5 000 текстовых запросов/час; до 10 изображений/сек; до 60 изображений/мин

Этот план для тех, кто делает агентов, небольшие сервисы или инструменты — когда бесплатные лимиты уже тесноваты, но до «тяжёлого продакшена» ещё далеко.

Цена: $12 в месяц
Повышенные лимиты, примерно: до 25 текстовых запросов/сек, до 1 500 текстовых запросов/мин, до 15 000 текстовых запросов/час, до 20 изображений/сек, до 120 изображений/мин
Плюс: Pro-модели, JSON-режим, Function / tool calling, Speech-to-text для продакшен-сценариев

Идея простая: те, кто завязан на llm7.io серьёзными задачами, должны иметь возможность получать стабильный, предсказуемый и более ёмкий доступ.

Мне не хотелось просто взять и сказать всем: «Платите или до свидания».

Бесплатный доступ остается, просто лимиты стали немного строже, чтобы сервис можно было поддерживать и чтобы он был менее привлекательной целью для абьюза.

Сейчас есть две основные бесплатные опции:

Анонимный доступ: (1) Без регистрации, (2) Примерно до 8k символов на запрос, (3) 100 запросов/час, 10 запросов/мин, 1 запрос/сек
Бесплатный авторизационный токен: его можно получить: https://token.llm7.io и будут следующие лимиты - до 128k символов на запрос, 200 запросов/час, 30 запросов/мин, 2 запроса/сек. Доступна генерация изображений (с водяным знаком)

Этого, на мой взгляд, достаточно, чтобы быстро попробовать API, собрать небольшой MVP и понять, нужна ли вам платная подписка - без договоров, бумажек и прочей бюрократии.

Для большей прозрачности я обновил документацию: https://docs.llm7.io/quickstart

Если вы дочитали до этого места и думаете попробовать платный план, хочу поделиться промокодом.

Можно использовать:

VIBECODE2025NOV

чтобы получить 50% скидку на первый месяц любой подписки llm7 (Vibe или Pro).

Промокод действует до 23:59 30 ноября 2025 года по Лондонскому времени.

Одной из самых приятных и мотивирующих вещей для меня стало сообщество вокруг этого маленького проекта. Быстрый поиск по GitHub уже показывает примерно 150 open source-интеграций, где упоминается llm7.io.

Для чего-то, что начиналось как «проверить архитектуру под нагрузкой», это выглядит довольно неожиданно и очень приятно.

Дальнейшие шаги во многом зависят от:

количества платных подписчиков
обратной связи по лимитам, ценам и функционалу

К концу декабря у меня будет более чёткое понимание, куда двигаться дальше. Но одно я знаю точно: я хочу продолжать развивать сервис:

улучшать производительность и надёжность
добавлять новые модели
приносить больше пользы разработчикам и, через них, конечным пользователям

Спасибо, что вы есть - независимо от того, отправили вы один запрос или миллион.

Увидимся в следующий раз. Уверен, довольно скоро :)

С Уважением,

Евгений

50 миллиардов токенов спустя: мой путь развития llm7.io с нуля

Абьюз, атаки и «бессмысленный» трафик

Внедрение подписки

Vibe: для агентов, пет-проектов и небольших internal tools

Pro: для более серьёзных нагрузок

Бесплатный доступ никуда не делся и все также доступен

Небольшой бонус для читателей

Планы на будущее