Диалоговые тренажеры с ИИ: от первого MVP к комплексной симуляции
2,5 года назад мы создали наш первый MVP диалогового тренажера с ИИ в Articulate Storyline. Тогда сотрудник в роли продавца подбирал тарифы мобильной связи, а в конце получал обратную связь от «глупой» по современным меркам GPT-3.5. Результат был сырым, но очень показательным. Подробный (даже с перебором) разбор того пилотного проекта можно посмотреть ТУТ.
Новый демо-проект, использует современные модели и подходы, выводя идею на новый уровень.
Что сделали сейчас?
Это демонстрационный кейс для банковской сферы (все данные клиентов, банк и ПО вымышлены). Его цель — показать, на что уже способны диалоговые тренажеры с ИИ.
Ключевые фишки проекта:
1. Полный цикл работы оператора.
Сотрудник колл-центра не просто общается, а выполняет задачи в симуляции «реального» банковского ПО. Он проверяет счета, блокирует и перевыпускает карты, сбрасывает пароли, и.т.д. — все как в реальности.
2. Живой голосовой диалог. Взаимодействие с клиентом происходит голосом. ИИ не просто генерирует текст, а проговаривает его, реагируя на слова и вектор беседы оператора.
3. Взаимосвязь действий и диалога.
Это самая интересная часть системы. При необходимости, можно настроить изменение диалога и поведения клиента в зависимости от совершенных в системе действий, например:
- Если оператор в ПО отправляет клиенту SMS-уведомление, ИИ-клиент его «получает» и тут же упоминает в разговоре.
-Ошибка в проведенной операции (например, ошибочная блокировка карты) сразу меняет контекст беседы: клиент расстраивается, реагирует с недовольством или задает уточняющие вопросы.- Конечно, возможны и более сложные сценарии, когда клиент «перезванивает через неделю» и продолжает диалог (например, чтобы наглядно продемонстрировать к чему привели ошибки в разговоре, или просто как продолжение сложного.
4. Комплексная оценка.
Система может фиксировать и оценивать не только то, что сказал оператор, но и что он сделал в интерфейсе, и насколько слаженно прошли оба эти процесса.За счет этого процесс становится максимально иммерсивыным и позволяет не только получать знания, но и формировать умения, при этом в безопасной среде и без стресса для сотрудника (особенно для новичка).
Что под капотом?
В основе лежат технологии OpenAI: современная языковая модель, преобразование речи в текст и обратно.
Готовый тренажер, при необходимости, упаковывается в SCORM и загружается в любую LMS (статистика передается в LMS точно так же, как в обычном курсе).
(тему о том, что для сложных data-driven проектов будущего нужен xAPI, а не SCORM, оставим на потом)
Сколько это стоит?
Ценообразование в таких проектах — тема отдельного большого разговора.
Если коротко: цена одного диалога зависит от используемых моделей ИИ, его длительности и объема контекстных инструкций для ИИ-персонажа. Чем «умнее» модель, дольше разговор и больше контекст – тем дороже.
В этом конкретном демо-кейсе один диалог обходится примерно в 5 рублей.
Если готовы к небольшим компромиссам – можно снизить цену в 2-3 раза, но все зависит от кейса.
Такой подход создает уникальный гибридный формат обучения. Он находится ровно посередине между стандартным SCORM-курсом, который дает знания, и дорогостоящим тренингом с живым тренером, который дает практику.
Тренажер не заменяет полноценного наставника, но создает безопасную и максимально приближенную к реальности среду, где можно без риска совершать ошибки, отрабатывать сложные сценарии и формировать устойчивые умения, сочетающие в себе и коммуникацию, и работу с цифровыми инструментами.
Кстати, я веду свой канал в Телеграм про разработку курсов. Рассказываю о своем опыте и простых решениях сложных задач, в том числе про использование ИИ в e-learning. Присоединяйтесь.