6 open-source инструментов, чтобы понять, куда уходят деньги вашего AI-агента
Ваш AI-агент тратит деньги. Вы можете объяснить - на что именно? Не общий счет за месяц. А разбивку: какой LLM-вызов сколько стоил, какой tool call запустил цикл навигации по файлам, почему одна задача обошлась в $4, а похожая - в $0.50.
Большинство команд не могут. Они видят инвойс, а не трейс. Это как вести бизнес без бухгалтерии - деньги уходят, а куда именно - непонятно.
Как я нашел проблему
Две почти одинаковые задачи вернулись с разницей в 8 раз по стоимости. Без трейсинга - где видно каждый LLM-вызов, каждый вызов инструмента, каждый запуск суб-агента с точным количеством токенов и стоимостью - я бы никогда этого не обнаружил.
Дорогой запуск сжигал токены на навигационных циклах, а не на реальной работе. Агент раз за разом читал одни и те же файлы, сканировал директории, пересобирал контекст.
Фикс оказался неожиданным: экспортировать полный трейс и скормить его фронтирной модели (Claude Opus, GPT-4.1 - самой мощной из доступных) с просьбой проанализировать конфигурацию агента.
Результат: снижение стоимости на 60%. За одну итерацию.
Проблема не в цене агентов
Проблема в том, что без observability нельзя отличить агента, который работает, от агента, который потерялся. Оба тратят токены. Оба возвращают результат. Но один делает это за $0.50, а другой - за $4.
6 инструментов, которые это решают
Все open-source. Реальные проекты с реальными метриками.
Langfuse - 24.8K звезд на GitHub
YC W23, в январе 2026 куплен ClickHouse (раунд Series D на $400M). OpenTelemetry-native трейсинг, эвалюации, управление промптами. 26M+ установок SDK в месяц. Де-факто стандарт в индустрии.
Opik от Comet - 18.6K звезд
Трейсинг агентов плюс автоматические эвалюации плюс продакшен-дашборды. Встроенный Agent Optimizer, который сам улучшает промпты. Основатель Gideon Mendels - ex-Google, Columbia University.
TensorZero - 11.1K звезд
LLMOps на Rust. Gateway с латенси менее 1ms (p99), observability, эвалюации, оптимизация, встроенное A/B тестирование. Seed-раунд $7.3M. В команде - мейнтейнер компилятора Rust.
Arize Phoenix - 9.2K звезд
Обнаружение дрифта, кластеризация, встроенные эвалюации. Только что закрыли Series C на $70M - крупнейший раунд в AI observability. 2M+ скачиваний в месяц.
Laminar - 2.7K звезд
YC S24. Создан специально для агентов, а не для общего LLM-мониторинга. Трейсинг одной строкой для Vercel AI SDK, Browser Use, LangChain, OpenAI, Anthropic. Основатели - ex-Palantir и ex-AWS. Ангельский инвестор: Ben Sigelman, сооснователь OpenTelemetry.
Microsoft Agent Governance Toolkit
Вышел 2 апреля 2026. Первый тулкит, покрывающий все 10 рисков OWASP для агентного AI. Политики применяются за субмиллисекунды. 7 пакетов: Python, TypeScript, Rust, Go, .NET. MIT-лицензия.
Паттерн, который я вижу
Команды, которые добавляют трейсинг на раннем этапе, находят 40-60% снижения стоимости за несколько итераций. Команды, которые пропускают этот шаг, продолжают платить и гадать - почему так дорого.
Какой у вас сейчас подход к observability для агентов - трейсите или работаете по логам?