7 идей с конфы Code w/ Claude

Посмотрел, наконец, конфу Code w/ Claude, мои топ 7 идей + одна центральная тема всех выступлений ниже:

1) Haiku берёт Opus в эдвайзеры - CPO GitHub рассказал про их хак: даёте агенту, работающему на слабой модели (haiku) эдвайзера на модели поумнее, и в случае чего он обращается к ней за помощью, простым tool call-ом. Красиво; детальнее тут и тут

2) Время полураспада агента - любой код, компенсирующий непредсказуемость поведения агента имеет время полураспада равное месяцам (6-12 обычно) —> лабы его реализуют как встроенная возможность модели/api; а вот код, "подключающий" агента к вашему уникальному миру (контекст, авторизация, внешние системы и тп) - реально уникален и туда должны быть приложены наши усилия —> источник

3) Как работет Claude Code команда - команда отказывается от долгосрочных роадмапов (just in time planning) и ряда других процессов; технические дебаты решаются 2-3 альтернативными пулл-реквестами, узкое место свдигается на проверку, безопасность —> источник

4) Дайте каждому агенту свой компьютер с теми же тулами и "глазами", что и у вас - онбординг для агентов должен быть аналогичен онбордингу сотрудника + юзаем computer use + self improvement loop (каждый агент репортит ошибки/затруднения, затем их решают люди + агенты, и потом рой агентов тестит и подтверждают что полегчало). Источник

5) Оценивайте новую версию модели по тому, помогает ли она вам удалить код - лучший сигнал, что надо апгрейдиться, что вы теперь можете удалить какой-то код/сократить промпт. Источник

6) 3 аспекта памяти агента: хранение, структура, процесс - проектируя память агента, мы должны ответить на 3 класса вопросов: где хранится память, структура (.md файлы для памяти, скиллы - как "процессная" память), и процесс (что триггерит обновление, как оно происходит). Источник

7) Закон Amdahl как бизнес стратегия - если вы ускоряете один этап процесса в 3-5 раз, то все остальные становятся узким местом; задачей CEO/продакта должны стать те самые медленные стадии, что ограничивают прогресс; причем желательно перепроектировать/инвестировать в них сразу, а не делать после. Идеально вписывается в мои заметки с полей (1, 2). Следующие юникорны будут в областях, в которых кто-то сможет построить инфраструкутуру для верификации/оценки аутпута модели, которой нет у других. Источник

Центральная тема всех токов имхо:

узкое место сдвигается в инфраструктуру вокруг модели - harness, системы обратной связи, системы верификации, контекст и память, безопасная работа агентов, эвалы.

Разумеется, там сильно больше, чем эти 7, поэтому приятного просмотра!

Подписывайтесь на Telegram EDU.

3
3 комментария