Самообучающиеся агенты: слек-боты для улучшения взаимодействия с клиентами
Самообучающиеся агенты
Запилил вчера на хакатоне такую штуку: слек-бот, который обучается на том, как его исправляет человек, и другим ботам передает это знание, если оно им релевантно.
Например, у вас сейлз бот и он помогает вам отвечать на запросы клиентов, но иногда он выдает слишком длинное сообщение, или напридумывает всякого. Вы просто отвечаете клиенту так, как вы хотите, а система учится и учит ботов других клиентов или других ботов этого же. Такая вертикальная и горизонтальная эволюция.
Причем я решил не делать сложные reinforcement learning и тп, а просто подправка правил в промптах. Так, по моему мнению, выходил проще, понятнее и быстрее.
Ничего не выиграл, к сожалению, но запилил, что хотел и будем точно встраивать в продакшн.
Подписывайтесь на Telegram EDU.