{"id":14291,"url":"\/distributions\/14291\/click?bit=1&hash=257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","hash":"257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","title":"\u0420\u0435\u043a\u043b\u0430\u043c\u0430 \u043d\u0430 Ozon \u0434\u043b\u044f \u0442\u0435\u0445, \u043a\u0442\u043e \u043d\u0438\u0447\u0435\u0433\u043e \u0442\u0430\u043c \u043d\u0435 \u043f\u0440\u043e\u0434\u0430\u0451\u0442","buttonText":"","imageUuid":""}

Иван

11 фев в 10:48 11 фев

Сравнение возможностей чат-ботов с ИИ на примере решения задач UX-исследователя

Сегодня я поделюсь с вами результатами сравнения популярных чат-ботов с генеративным искусственным интеллектом. В этой статье я расскажу об их возможностях, ограничениях и особенностях использования.

В моем сравнении участвовали:

ChatGPT;
Claude.ai;
Bard;
Bing Chat;
YaGPT;
GigaChat.

Оценка качества работы чат-ботов дана на основе личного опыта использования.

Хочу сразу оговориться, что результаты работы чат-ботов могут варьироваться в зависимости от конкретного инструмента и задачи, а качество выдачи может быть неидеальным. Иногда, чтобы достичь желаемого результата, приходится дополнительно уточнять запросы или просить чат-бота раскрыть тему подробнее. Также важно осознавать, что при проведении анализа чат-боты с ИИ могут упускать часть информации или допускать ошибки.

Несмотря на недостатки, чат-боты уже сейчас могут стать полезными помощниками в работе исследователя, а со временем их возможности будут только расти.

В общем, если вы давно интересовались чат-ботами с ИИ и думаете о том, какой из них выбрать для работы, эта статья для вас.

Сравнение чат-ботов с генеративным ИИ

Давайте проведем сравнение ключевых особенностей чат-ботов на базе генеративного ИИ.

Для быстрого старта идеально подходят ChatGPT или Bard. Они просты в использовании, не требуют сложной регистрации и позволяют сразу начать экспериментировать с ИИ.

GPT-4 – хороший выбор для работы с данными, текстом и генерации картинок в одном инструменте. Нужна регистрация и оплата подписки.

Claude – лучшее решение, когда нужен анализ больших объемов текста. Сэкономит много времени на обработке данных из интервью и опросов.

Bing Chat, YaGPT и GigaChat, на мой взгляд, не очень полезны для решения профессиональных задач на текущий момент.

Идеальный вариант – комбинировать несколько чат-ботов. Это позволит получить максимально точный и полный результат за счет сильных сторон разных ИИ.

В следующих разделах я поделюсь с вами детальным анализом и примерами работы чат-ботов, чтобы вы могли на практике оценить их возможности.

Сравнение качества генерации текста

Для сравнения возможностей генерации один и тот же запрос на генерацию текста был отправлен в 7 популярных чат-ботов с ИИ. Запрос звучал так:

«Представь, что ты опытный исследователь юзабилити. Перед тобой стоит задача разработать хороший шаблон дизайна исследования. Шаблон нужен, чтобы заказчик и исследователь смогли согласовать цели, методы, этапы, результаты и другие важные детали проекта».

На основе этого запроса чат-боты сгенерировали свои варианты шаблона. Далее я оценил качество текста от 1 до 5 звезд.

В этой статье я демонстрирую сравнение, опираясь на один пример. Однако, основываясь на моем личном опыте, могу сказать, что результаты от этих чат-ботов будут схожи по качеству на большинство запросов.

GPT-3.5

Качество генерации текста: ★★★

Структура шаблона в целом логичная, но не хватает важных разделов. Формулировки больше похожи на заголовки подразделов. Присутствуют лишние разделы, нет единообразия стиля.

GPT-4

Качество генерации текста: ★★★★★

Структура хорошая, но есть несущественные разделы. Заголовки в разных стилях, зато описания в нужном формате.

Claude 2.1

Качество генерации текста: ★★★★★

Структура полная и логичная, все разделы уместны. Описания похожи на подразделы. Выдержан единый стиль.

Bard

Качество генерации текста: ★★★★★

Структура продуманная, разделы логичны. В тексте попадаются ошибки. Выдержан единый стиль.

Bing Chat

Качество генерации текста: ★

Просто выдал отрывки не совсем подходящих статей. Не годится для создания шаблона.

YandexGPT

Качество генерации текста: ★★

Структура нормальная, но только поначалу. Далее следует бессистемный набор текста, больше похожий на отчет.

Giga Chat

Качество генерации текста: ★★

Сгенерированный текст больше похож на отчет. Не подходит в качестве шаблона.

Таким образом, наиболее эффективными в выполнении профессиональных задач оказались Claude 2.1, GPT-4 и Bard. Остальные чат-боты показали меньшую эффективность в решении специализированных задач, но их возможности продолжают расти.

Сравнение качества анализа текста чат-ботами с ИИ

Чтобы оценить способность чат-ботов работать с большими объемами текстовой информации (расшифровки интервью, ответы на открытые вопросы и т.д.), я загрузил в них расшифровку интервью и попросил подготовить сводный отчет по заданной мной структуре. Мой запрос звучал следующим образом:

«Привет! Представь, что ты –часть команды опытных UX-исследователей и профессиональных аналитиков текстовой информации. Перед тобой стоит задача проанализировать и систематизировать информацию из предоставленной расшифровки интервью. Цель – подготовить исчерпывающий отчет об опыте пользователя на платформе "Турнир.ру". Проанализируй расшифровку и структурируй данные в соответствии со следующей структурой:

общий профиль пользователя;
описание решаемых задач;
драйверы участия;
барьеры участия;
причины оттока;
проблемы пользователя.

Помни, что важно опираться исключительно на информацию из интервью, не добавляя ничего от себя».

В итоге чат-боты проанализировали текст расшифровки и сформировали отчет по заданной структуре.

GPT-4

Качество анализа текста: ★★★★

Выделил ключевую информацию, но упустил некоторые важные детали. Хорошо структурировал данные в нужном формате.

Одну звезду снял из-за ограничения на обработку информации до 7 страниц текста за раз.

Claude 2.1

Качество анализа текста: ★★★★★

Выделил практически всю важную информацию, детализировал ключевые моменты. Отлично структурировал данные в заданном формате.

Bard

Качество анализа текста: ★★★★

Сделал хороший свод важной информации по разделам. Есть небольшие потери важной информации.

Одну звезду снял из-за ограничения на обработку информации до 8 страниц текста за раз.

GigaChat

Качество анализа текста: ★★★

В целом неплохо выделил ключевые моменты. Во всех разделах присутствуют потери важных деталей. Плохо оформляет данные, нужна большая доработка.

Также есть ограничение на ввод текста – до 8 страниц за раз.

Несмотря на текущие ограничения, чат-боты на базе генеративного ИИ уже сейчас демонстрируют впечатляющие результаты при решении профессиональных задач UX-исследователя.

Лидерами среди рассмотренных мной инструментов можно назвать Claude 2.1, GPT-4 и Bard. Они позволяют эффективно генерировать тексты, анализировать данные и значительно облегчают рутинную работу с обработкой информации.

Разумеется, чат-боты пока не способны полностью заменить квалифицированного специалиста. Требуется комбинировать возможности ИИ и профессиональные навыки человека, чтобы достичь лучшего результата в работе.

В то же время потенциал для автоматизации ряда задач и повышения эффективности рабочих процессов в сфере UX-исследований уже сложно недооценивать.

Рекомендую начать экспериментировать с чат-ботами и искать способы их применения, ориентируясь на ваши задачи и специфику работы.

12K показов

951 открытие

1 комментарий

Slava Alk

14 фев

спасибо большое за статью! очень полезная и экономит время

Ответить

Развернуть ветку

Написать комментарий...

-2 комментариев

Раскрывать всегда