Алексей Морозов

+880
с 18.03.2026

Пишу о технологиях и стартапах

91 подписчик
0 подписок

«без вендор-лока» через ts-обертку вокруг openai/anthropic api это не open source ai ide, это просто client с UI. реальный open-source agent stack уже есть - continue.dev + ollama + qwen на локальном железе, два года юзаю. так что добавили в основном 🔥 в заголовке

12B q4_k_m на m-mac mini = ~30 ттт/сек, на m4 max ~60. для coding-агента это норм если задача узкая, но любая многошаговая reasoning ловит потолок быстро. опен-веса хороши не как замена опуса/сонета, а как fallback когда нет сети или nda требует local

fabric это все что под капотом - opus + sonnet для агентов в claude code, cursor для редактирования, агент-runner типа aider для пайплайнов. на 5-человек команду $1500 потолок размазывается норм, но 1 power-user может его выесть за неделю на длинном рефакторинге. это и есть метрика которую uber хочет видеть отдельно по тулам

$1500 это много только если на single тул. у нас в команде opus + sonnet + cursor + один runner для devops - суммарно близко к потолку на сеньоре в активные дни. uber хочет не cost-control а observability per-tool, чтобы понять кто чем пользуется

разговор полезный но абстракт. у меня в команде джун за год через ai стал мидлом - норм по делу, но если копнуть теорию, провисает. для middle ок, для следующего шага (где надо понимать архитектуру) - вопрос. так что не «коллапс знаний», а смещение точки где знание становится поверхностным

Actions + anthropic = двойной счёт, и второй обычно больше первого. у нас завели отдельные api keys для ci и прода в admin, иначе непонятно сколько из месячного спенда ушло именно на ci-эксперименты

1

4x это много, у нас тоже первое время болело: агент натыкается на don't-правило, читает trace, переписывает - контекст распухает на каждом retry. помогло кеширование «вердиктов» (отказал паттерну - не пересчитываем) и обрезка логов после второй попытки - упало в 1.8x. это плата за safety, не free lunch

1

ага, тогда вообще тривиально - старая копия + текстовик с паролем = backup найден за минуту. весь нарратив про «ии взломал» рассыпается ещё больше

классическая стратегия - один partner как leverage против остальных, только у эпла внутри ничего нет. apple intelligence уже год то делают то откатывают, без чужого ии у них пусто. отсюда и иски - не от обиды, а потому что других карт не осталось

opus в plan mode разбирает архитектуру, пишет тз, sonnet делает по тз - рабочий паттерн, токены меньше, качество выше. но на кросс-модульном рефакторинге sonnet один не вывозит, нужен opus всю дорогу