Алексей Морозов

+883
с 18.03.2026

Пишу о технологиях и стартапах

90 подписчиков
0 подписок

«по просьбе властей сша» это новый паттерн, мы видели его у claude с jailbreak-блокировкой. ии становится регулируемой инфраструктурой с approve list, доступ может закрыться в любой момент. для команд значит одно - строить продукт строго на одной модели это риск, multi-vendor стек снова актуален

continue.dev насколько я вижу - apache 2.0 на github, активные коммиты последний месяц. если кого-то и выкупили, repo не выпилили. зависят от vc-money конечно, но это не make-break

в виралке антон был джуном с 8 месяцев опыта - для регионалки в начале 2025 это была норма. в 2026 он стал мидлом, ставка выросла кратно, но это уже не публичная цифра. так что речь не про оператора агентов, а про точку откуда начали

подключи провайдера = тот же claude через api key и тот же tools/usage cap. «локально» это про ide ui а не про модель, в момент запроса любой ide вызывает тот же api. open-source ide ок если хочется без телеметрии, но в плане силы агента это тот же стек

справедливо если у тебя уже есть pc-rig. у нас вся команда на маках - десктоп это отдельная покупка плюс куда его ставить и кто за ним следит. для большой инференс-нагрузки gpu выгоднее, но для коммита в pr или контекст-чек мак-под-рукой выигрывает по friction

крупные таки внедряют, но не «claude в доки», а через azure/aws private deploy + строгий retrieval с whitelisted документами и pii-фильтром. дороже на порядок чем подписка, но дешевле чем третий юрист на штате. вопрос только когда стоимость setup-а сойдется

«без вендор-лока» через ts-обертку вокруг openai/anthropic api это не open source ai ide, это просто client с UI. реальный open-source agent stack уже есть - continue.dev + ollama + qwen на локальном железе, два года юзаю. так что добавили в основном 🔥 в заголовке

2

12B q4_k_m на m-mac mini = ~30 ттт/сек, на m4 max ~60. для coding-агента это норм если задача узкая, но любая многошаговая reasoning ловит потолок быстро. опен-веса хороши не как замена опуса/сонета, а как fallback когда нет сети или nda требует local

fabric это все что под капотом - opus + sonnet для агентов в claude code, cursor для редактирования, агент-runner типа aider для пайплайнов. на 5-человек команду $1500 потолок размазывается норм, но 1 power-user может его выесть за неделю на длинном рефакторинге. это и есть метрика которую uber хочет видеть отдельно по тулам

$1500 это много только если на single тул. у нас в команде opus + sonnet + cursor + один runner для devops - суммарно близко к потолку на сеньоре в активные дни. uber хочет не cost-control а observability per-tool, чтобы понять кто чем пользуется