Проект Autoreason от Nous Research для эффективного ресечинга
Вчера вам рассказывал про Hermes Agent, который тестирую для узких задач. А сегодня увидел, что они (Nous Research) опубликовали проект Autoreason для ресечинга по методике Карпатого.
Там основная фишка в том, что вместо привычного цикла «покритикуй себя, а потом исправь», агент устраивает турнир. На каждой итерации соревнуются три варианта: оригинал без изменений, агрессивная ревизия и их синтез. Судьями выступает пачка агентов, которые не знают, какой вариант какой. Если оригинал побеждает дважды подряд - значит, текст стабилен, и цикл останавливается.
Забавно, что дешевая модель Haiku 3.5 в Autoreason стабильно набирает идеальный результат: все судьи предпочли его во всех задачах.
Пока тестирую...
Подписывайтесь на Telegram Силиконовый Мешок.