50 миллиардов токенов спустя: мой путь развития llm7.io с нуля
Дисклеймер: эту статью написал человек.
Всем привет, меня зовут Евгений. В апреле 2025 года я запустил небольшой пет-проект - llm7.io.
Изначально это вообще не задумывалось как «продукт». Я делал его под свои задачи, а заодно открыл простой chat-compatible API endpoint, через который любой желающий мог получить доступ к LLM-моделям. Одна из ключевых целей была личной: проверить свои инженерные навыки и архитектуру под реальной prod-нагрузкой.
Спустя почти семь месяцев этот «маленький эксперимент» превратился во что-то гораздо более серьёзное, чем я ожидал.
За это время llm7.io пришлось быстро повзрослеть.
- Всего обработано более 50 миллиардов токенов
- Около 184 миллионов запросов
- Ежемесячная аудитория - примерно 56 тысяч уникальных пользователей
Сервис практически всё время работал 24/7, было меньше десяти простоев, каждый из которых я старался чинить максимально оперативно (+- несколько часов). Для одиночного пет-проекта я этим искренне горжусь. Это значит, что люди реально используют llm7.io для прототипирования идей, построения инструментов и экспериментов - и инфраструктура в целом выдерживает.
Но вместе с ростом пришли и проблемы.
Абьюз, атаки и «бессмысленный» трафик
В какой-то момент стало ясно: полностью безлимитный бесплатный доступ - невозможен. Не столько технически и финансово, но и по отношению к тем, кто пользуется сервисом ответственно.
В августе и сентябре сервис начал получать довольно странную нагрузку. Внешне запросы выглядели «прилично»: без мата, без очевидно вредоносного контента. Но если присмотреться, запросы были по сути бессмысленной мешаниной слов, повторяющейся по кругу - явно не реальное, или лучше сказать - осмысленное использование.
Кто-то потратил немало времени, чтобы автоматизировать отсылку мусора. Запросы приходили на верхней границе rate limit, каждую секунду, неделями подряд. Скорее всего, цель была проста: забить очередь, перегрузить систему и сделать сервис неудобным для всех остальных (если идея была «обанкротить llm7 бессмысленными запросами» — спойлер: в таком виде это не сработает).
Для меня это превратилось в своеобразную задачу:
Как сохранить llm7.io открытым и полезным для обычных пользователей, и при этом защитить его от тех, кто воспринимает «бесплатно» как «безлимитно и безответственно»?
Одних только rate limit'ов уже было недостаточно. В итоге я пришёл к довольно простому выводу: чтобы обеспечить нормальный доступ ответственным пользователям, какая-то форма платной подписки неизбежна.
Внедрение подписки
Со стороны «ну давай сделаем подписку» звучит просто. На практике это затрагивает почти всё:
- Аутентификацию и биллинг
- Лимиты и квоты
- Мониторинг и защиту от абьюза
- Планирование инфраструктурных затрат
- UX, документацию, поддержку и ожидания пользователей
После нескольких итераций я остановился на двух уровнях подписки, которые самому кажутся разумными: Vibe и Pro.
Vibe: для агентов, пет-проектов и небольших internal tools
- Цена: $5 в месяц
- Примерные лимиты: до 10 текстовых запросов/сек; до 600 текстовых запросов/мин; до 5 000 текстовых запросов/час; до 10 изображений/сек; до 60 изображений/мин
Этот план для тех, кто делает агентов, небольшие сервисы или инструменты — когда бесплатные лимиты уже тесноваты, но до «тяжёлого продакшена» ещё далеко.
Pro: для более серьёзных нагрузок
- Цена: $12 в месяц
- Повышенные лимиты, примерно: до 25 текстовых запросов/сек, до 1 500 текстовых запросов/мин, до 15 000 текстовых запросов/час, до 20 изображений/сек, до 120 изображений/мин
- Плюс: Pro-модели, JSON-режим, Function / tool calling, Speech-to-text для продакшен-сценариев
Идея простая: те, кто завязан на llm7.io серьёзными задачами, должны иметь возможность получать стабильный, предсказуемый и более ёмкий доступ.
Бесплатный доступ никуда не делся и все также доступен
Мне не хотелось просто взять и сказать всем: «Платите или до свидания».
Бесплатный доступ остается, просто лимиты стали немного строже, чтобы сервис можно было поддерживать и чтобы он был менее привлекательной целью для абьюза.
Сейчас есть две основные бесплатные опции:
- Анонимный доступ: (1) Без регистрации, (2) Примерно до 8k символов на запрос, (3) 100 запросов/час, 10 запросов/мин, 1 запрос/сек
- Бесплатный авторизационный токен: его можно получить: https://token.llm7.io и будут следующие лимиты - до 128k символов на запрос, 200 запросов/час, 30 запросов/мин, 2 запроса/сек. Доступна генерация изображений (с водяным знаком)
Этого, на мой взгляд, достаточно, чтобы быстро попробовать API, собрать небольшой MVP и понять, нужна ли вам платная подписка - без договоров, бумажек и прочей бюрократии.
Для большей прозрачности я обновил документацию: https://docs.llm7.io/quickstart
Небольшой бонус для читателей
Если вы дочитали до этого места и думаете попробовать платный план, хочу поделиться промокодом.
Можно использовать:
VIBECODE2025NOV
чтобы получить 50% скидку на первый месяц любой подписки llm7 (Vibe или Pro).
Промокод действует до 23:59 30 ноября 2025 года по Лондонскому времени.
Планы на будущее
Одной из самых приятных и мотивирующих вещей для меня стало сообщество вокруг этого маленького проекта. Быстрый поиск по GitHub уже показывает примерно 150 open source-интеграций, где упоминается llm7.io.
Для чего-то, что начиналось как «проверить архитектуру под нагрузкой», это выглядит довольно неожиданно и очень приятно.
Дальнейшие шаги во многом зависят от:
- количества платных подписчиков
- обратной связи по лимитам, ценам и функционалу
К концу декабря у меня будет более чёткое понимание, куда двигаться дальше. Но одно я знаю точно: я хочу продолжать развивать сервис:
- улучшать производительность и надёжность
- добавлять новые модели
- приносить больше пользы разработчикам и, через них, конечным пользователям
Спасибо, что вы есть - независимо от того, отправили вы один запрос или миллион.
Увидимся в следующий раз. Уверен, довольно скоро :)
С Уважением,
Евгений