6 open-source инструментов, чтобы понять, куда уходят деньги вашего AI-агента

Ваш AI-агент тратит деньги. Вы можете объяснить - на что именно? Не общий счет за месяц. А разбивку: какой LLM-вызов сколько стоил, какой tool call запустил цикл навигации по файлам, почему одна задача обошлась в $4, а похожая - в $0.50.

Большинство команд не могут. Они видят инвойс, а не трейс. Это как вести бизнес без бухгалтерии - деньги уходят, а куда именно - непонятно.

6 open-source инструментов, чтобы понять, куда уходят деньги вашего AI-агента

Как я нашел проблему

Две почти одинаковые задачи вернулись с разницей в 8 раз по стоимости. Без трейсинга - где видно каждый LLM-вызов, каждый вызов инструмента, каждый запуск суб-агента с точным количеством токенов и стоимостью - я бы никогда этого не обнаружил.

Дорогой запуск сжигал токены на навигационных циклах, а не на реальной работе. Агент раз за разом читал одни и те же файлы, сканировал директории, пересобирал контекст.

Фикс оказался неожиданным: экспортировать полный трейс и скормить его фронтирной модели (Claude Opus, GPT-4.1 - самой мощной из доступных) с просьбой проанализировать конфигурацию агента.

Результат: снижение стоимости на 60%. За одну итерацию.

Проблема не в цене агентов

Проблема в том, что без observability нельзя отличить агента, который работает, от агента, который потерялся. Оба тратят токены. Оба возвращают результат. Но один делает это за $0.50, а другой - за $4.

6 инструментов, которые это решают

Все open-source. Реальные проекты с реальными метриками.

Langfuse - 24.8K звезд на GitHub

YC W23, в январе 2026 куплен ClickHouse (раунд Series D на $400M). OpenTelemetry-native трейсинг, эвалюации, управление промптами. 26M+ установок SDK в месяц. Де-факто стандарт в индустрии.

Opik от Comet - 18.6K звезд

Трейсинг агентов плюс автоматические эвалюации плюс продакшен-дашборды. Встроенный Agent Optimizer, который сам улучшает промпты. Основатель Gideon Mendels - ex-Google, Columbia University.

TensorZero - 11.1K звезд

LLMOps на Rust. Gateway с латенси менее 1ms (p99), observability, эвалюации, оптимизация, встроенное A/B тестирование. Seed-раунд $7.3M. В команде - мейнтейнер компилятора Rust.

Arize Phoenix - 9.2K звезд

Обнаружение дрифта, кластеризация, встроенные эвалюации. Только что закрыли Series C на $70M - крупнейший раунд в AI observability. 2M+ скачиваний в месяц.

Laminar - 2.7K звезд

YC S24. Создан специально для агентов, а не для общего LLM-мониторинга. Трейсинг одной строкой для Vercel AI SDK, Browser Use, LangChain, OpenAI, Anthropic. Основатели - ex-Palantir и ex-AWS. Ангельский инвестор: Ben Sigelman, сооснователь OpenTelemetry.

Microsoft Agent Governance Toolkit

Вышел 2 апреля 2026. Первый тулкит, покрывающий все 10 рисков OWASP для агентного AI. Политики применяются за субмиллисекунды. 7 пакетов: Python, TypeScript, Rust, Go, .NET. MIT-лицензия.

Паттерн, который я вижу

Команды, которые добавляют трейсинг на раннем этапе, находят 40-60% снижения стоимости за несколько итераций. Команды, которые пропускают этот шаг, продолжают платить и гадать - почему так дорого.

Какой у вас сейчас подход к observability для агентов - трейсите или работаете по логам?

Начать дискуссию