Создание скилла для Claude Code: тестовые задания и улучшение

Сделал скилл для Claude Code, который берет уже существующий скилл (например, по написанию кода, или по ведению задач в таск-менеджере), придумывает под него тестовые задания и критерии оценки.

Затем прогоняет эти задания на пачке ничего не подозревающих субагентов. Смотрит, как они отработали, находит косяки, составляет отчет, где агенты тупят, формулирует гипотезы, как улучшить исходный скилл, чтобы этот тупняк починить.

От меня тут надо только точно указать, какой результат я хочу получить на выходе и как его провалидировать

Потестирую недельку, и если все будет ок, то полностью зациклю процесс — чтобы скилл автоматически улучшался до тех пор, пока не будет выполнять задачу на 100% верно.

Подписывайтесь на Telegram Молянов.

Начать дискуссию