Сделал скилл для Claude Code, который берет уже существующий скилл (например, по написанию кода, или по ведению задач в таск-менеджере), придумывает под него тестовые задания и критерии оценки.
Затем прогоняет эти задания на пачке ничего не подозревающих субагентов. Смотрит, как они отработали, находит косяки, составляет отчет, где агенты туп…