Сэкономить на токенах — Александр Горный на vc.ru

В мире сейчас доступны десятки LLM-моделей достаточно высокого качества. При этом для многих запросов все они выдают практически одинаковый ответ, но цена их и на порядок отличаться может. Разработчики используют более качественные продукты ради одного случая из ста, когда качество действительно может понадобиться, а платят зря все остальные 99 случаев.

Российский #стартапдня LeanLLM сэкономит часть этих денег. По замыслу основателей их продукт ставится как прослойка между программным кодом и нейросетями. При появлении запроса он смотрит на его “сложность” и “специальность” и отправляет в самого подходящего по соотношению цена-качество провайдера. В простых вопросах – в дешевого, в сложных – в качественного, в медицинских – в того, который про медицину лучше отвечает, условно говоря.

Второй используемый способ экономии – замена встроенных размышлений нейронок. LeanLLM применяет дешевые LLM для построения плана запроса, дробит данные на кусочки и отправляет в дорогую сеть уменьшенный контекст. Обычно без потери качества финального ответа. Всегда с экономией денег.

Лучше всего механика работает на повторении тысяч похожих запросов – проверка тысяч юридических договоров или что-то аналогичное. Для таких сценариев LeanLLM обещает экономию до 40% от всех расходов на токены. Стоить клиенту это будет ровно в 2 раза меньше, стартап не берет денег за подписку, но хочет получать половину того, что вы не заплатили OpenAI, Anthropic и остальным.

Компания запущена совсем недавно, один из сооснователей – члена клуба ShareAI Петр Марков. Инвестиций проект пока не привлекал.

https://leanllm.ai/

#ai #технология #россия #сша #насвои

Подписывайтесь на Telegram Стартап дня. Александр Горный..