Всем привет! Продолжим про GPT. Раньше говорили про разные сценарии и влияние промтинга на ответы. Кажется пора сравнить в лоб чистый клиент web OpenAI (далее для удобства chat gpt) и сервис MonkeyJob на базе той же технологии. Создатели сервиса делают упор на убирании «под капот» промт-инженерии и даже сделали кнопку улучшающую запросы, чтобы пользователь концентрировался на проблеме которую решает, а не на том как же нужно структурировать ответ и т.д. В статье мы узнаем а есть ли в этом практическая польза и как запросы влияют на качества ответа одной и той же GPT Список кейсов и условия сравненияКакие кейсы сегодня будем рассматривать:Анализ файла с данными xlsxАнализ A/B теста лендинга по данным скриншотовПоиск данных в интернетеКонсультация по разработке для телеграммОбработка запроса на менторство и подготовка опросникаКонсультироваться по ссылке и генерировать примерыРецензия на статью по ссылкеУсловия сравнения:Все сравнения будут с одинаковым исходным запросом.Оба сервиса отвечают на базе Chat GPT-4oДля сравнения качества ответов сервиса будут применяться штатные решения и для MonkeyJob это кнопка улучшения запросов.MonkeyJob ответы в среднем на секунд 20-30 дольше, что кажется не критичным.Будем отправлять1 запрос и смотреть ответ на этот запрос, там где будут отправлены дополнительные вопросы это будет явно указаноПо итогам сравнения будут выдаваться баллы и chat GPT и Monkey JobДисклеймер - Выводы и баллы будут субъективны.Давайте же посмотрим на примерах стоит ли того доп ожидание ответов от Monkey Job или нет. Пример 1: Анализ данныхИсходные данные – xlsx файл с результатами обзвона, который мы использовали ранее.Проанализируй файл с обзвоном покупателей уцененных товаров на маркетплейсе , найди сегменты покупателей а так же найди инсайты для роста бизнеса продажи уцененных товаров сторонних продавцов на маркетплейсеИзначальный запросОтветы chat gptзагружаем файл, пытается считать данныеполучаем заголовкивидимо в заголовке навыка что не может считать данныеКак видим, он не справился с чтением файла, давайте попробуем еще раз:пробует еще разИ опять не смог считать файл с сложными заголовкамиОтветы Monkey JobДля начала используем улучшение запросаКак видимо добавилось некоторое количество деталей и сама структура запросаДалее запустим обработкукак видим файл считался успешноПосчитали первые данныеУвидели определенные паттерны в комментарияхПолучили инсайтыВыводКак видим, Monkey Job как минимум справился)) При этом ответы достаточно качественные и практичные, более того они в частично попадают в то, что в итоге было сделано(работа с описаниями и фото, про цену как основную причину покупки и т.д) . БаллыChat gpt 0 баллов, Monkey Job 1,5 балла (за решение в целом + за качество ответа).Пример 2: Анализ A/B тестаИсходные данные – скриншоты из яндекс метрики с результатами АБ эксперимента.скриншот 1скриншот 2 скриншот 3на лендинге запущен аб тест, в контрольном варианте 1я страница преимущества сервиса, кнопка попробовать бесплатно, далее примеры работы сервиса и еще одна кнопка попробовать, в варианте 1 - проверяем гипотезу что пользователи будут больше читать текст на лендинге перед авторизацией - убираем кнопку попробовать в 1-м блоке и оставляем под скриншотами работы сервиса ниже. При этом на 1-м листе в шапке есть кнопка войти которая так же позволяет авторизоваться как и кнопка попробовать бесплатно. На приложенных скринах результаты промежуточные по 3-м метрикам (время на сайте, клик на кнопку попробовать и авторизации) сделай предварительные выводыИзначальный запросОтветы chat gptКорректно распознались данные из скриншота и сразу выводы по метрикамостальные 2 метрики и выводыОбщий вывод и рекомендацииОтветы Monkey JobТак же корректно считало данные. При этом визуализация таблицами даже удобнееТак же делает первые выводы Промежуточные выводы и новые вводныеОба сервиса корректно считали данные из скриншотов и оба сделали схожие выводы, отличающиеся по рекомендациям но не критично. Добавим контекста «Давайте учтем, что на лендинг может приходить не вовлеченная аудитория, которая кликает 'попробовать', видит авторизацию и уходит. Цель эксперимента была увеличить вовлеченность пользователей, особенно тех, кто заинтересован в продукте. Можем ли мы пересмотреть данные и предложить изменения, которые помогут удержать таких пользователей?»Новый запросОтветы chat gptПересматривает выводы с учетом нового контекстаТак же пересматривает и новые метрикиИтоговые выводы с учетом нового контекстаОтветы Monkey JobПредварительно улучшим запрос, как видим он переструктурировалсяпоказывает еще раз данныеНовые выводы по 3-м метрикам и начало рекомендацийВот теперь ответы достаточно существенно отличаютсяВыводОтветы базового chatgpt достаточно общие, а вот Monkey Job сделал более полезные для практики выводы и дал более конкретные рекомендации. Так же тут мы видим насколько важно давать контекст для GPT, и то что нам в голове кажется «естественным» нужно не забывать передавать модели, для лучших и полезных ответов. БаллыТут отдадим chat gpt 0,5 балла за 1-й ответ и 0.25 за второй ответ и 1 балл отдадим Monkey Job за оба ответа.Пример 3: Поиск по интернетуИсходные данные – запрос на поиск средней зп по профессииОкей давай тогда найдем в публичном доступе информацию о средних уровнях зарплат в России у менеджеров проектов и менеджеров продуктов в 2024 годуИзначальный запросОтветы chat gptДостаточно быстро получили цифры и ссылки на источники, хотя они и кажутся несколько ниже чем в реальностиОтветы Monkey JobКажется что тут нет цифрНо если перейти по ссылке то источник супер релевантныйДля приведения к виду с цифрами, необходим был дополнительный запросВыводОтветы базового chat gpt кажется лучше– он сразу предоставил источники данных и уровень зп, но, если открыть ссылку от Monkey Job то ссылки (особенно на гетматч) более релевантны. Для такого же вида ответа понадобился еще 1 запрос.БаллыТут отдадим chat gpt 1 за скорость и формат ответа. Снизим 0.25 за то что понадобилось 2 ответа, но добавим это же за качество источников - итого 1 балл отдадим Monkey Job.Пример 4: Консультация по разработкеИсходные данные – нужно уточнить варианты как можно из веб сервиса перекидывать сообщения в телеграммЕсли пользователь в сервисе указывает свой тг, можно ли каким то образом реализовать отправку сообщения пользователя из сервиса в его телеграмм, предложи разные варианты, желательно способ реализации когда вызывается тг клиент пользователя и он отправляет себе в избранное»Изначальный запросОтветы chat gpt1й пример2 оставшихся примераОтветы Monkey JobПервым делом опять попробуем улучшить запроскак видим запрос заузился и пропало про разные способыТут сервис выбрал основной сценарий - через бота Описал подробно и даже выдал ссылки на документациюВыводОтветы базового chatgpt разнообразнее – он сразу предоставил несколько вариантов, а вот Monkey Job улучшил запрос до решения задачи убрав многообразие, но при этом проработанность решения выше и есть ссылка на документацию. БаллыТут отдадим chat gpt 1 балл и 0.75 балла отдадим Monkey Job(чуть снизим за разнообразие, но добавим за качество ответа).Пример 5: Входящий запрос на менторство и подготовка опросникаИсходные данные – входящее сообщение с тг, запросом на консультацию, надо составить опросник, чтобы лучше понять ситуациюдля ментора проджект менеджеров пришел запрос "Запрос: Добрый день Недавно внедрила в бизнес процессы проджект менеджера, хочу, чтобы с ним поработали, оцифровать его процессы, убедиться, что функционал реально улучшает работу в компании и ускоряет получение результата" нужно составить список вопросов для обучающегося, чтобы получить более полное описание кейса и решаемую задачуИзначальный запросОтветы chat gptОтветы Monkey JobУлучшение запросов не использовалось для того, чтобы не искажать запрос клиентаВыводОтветы базового chat gpt более общие и за счет этого под задачу подходят даже лучше. Ответ Monkey Job более специализированные, но на таком этапе их адаптация под запрос займет чуть больше времени. БаллыТут отдадим chat gpt 1 и 0.75 балла отдадим Monkey Job за излишнюю детализацию для конкретной задачиПример 6: Работа со ссылкой + консультацияИсходные данные – запрос на объяснение механики дарения от юр лица физическому лицу с примерамиhttps://delo-press.ru/faq/law/43682-kakie-nalogovye-posledstviya-vozniknut-u-kommercheskoy-organizatsii-kotoraya-darit-podarki-stoimostyu/#:~:text=%D0%A1%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D0%BE%20%D0%BF%D0%BE%D0%B4%D0%BF.,%D0%BA%D0%BE%D1%82%D0%BE%D1%80%D1%8B%D1%85%20%D0%BD%D0%B5%20%D0%BF%D1%80%D0%B5%D0%B2%D1%8B%D1%88%D0%B0%D0%B5%D1%82%203000%20%D1%80%D1%83%D0%B1. на основании этой статьи опиши все ограничения на дарение от юридического лица физическому, приведи примерыИзначальный запросОтветы chat gptс первого раза chat GPT не справилсяУказан пример, но не указаны ограничения в виде налогового периода и т.д.Ответы Monkey Jobсначала улучшим запроспоймем что у нас есть последствия и ограниченияУказаны пункты законодательства где можно проверить и ряд ограниченийУказано как работает вычет НДС при даренииУказаны штрафы Вывод:Ответы базового chat gpt короткий, правильный но содержит слишком мало деталей, при этом ответ не с первого, а вот Monkey Job ответ более развернутый -указаны статьи, где можно посмотреть самостоятельно, ряд ограничений для работы с дарением. БаллыТут отдадим chat gpt 0.5 (минус за ответ не с первого раза и слишком поверхностный ответ) и 1.5 балла отдадим Monkey Job(за более развернутый ответ и источники)Пример 7: Рецензия статьиИсходные данные – ссылка на мою предыдущую статью и предложение написать рецензию на постнапиши рецензию поста https://vc.ru/chatgpt/1234464-klassy-zadach-kotorye-mozhno-reshat-s-gpt-i-effekt-ot-ekonomii-vremeni-na-lichnom-opyte-chast-2-longridИзначальный запросОтветы chat gptТут мы видим краткий пересказ статьи вместо рецензииОтветы Monkey JobОпять жмем кнопку улучшения запроса, в нем появилось про экономию времени и пользуТак же получаем пересказ статьи, но более детальныйИ наконец получаем заключение от ассистента, так же за счет развернутого ответа, есть за что зацепиться и уйти в обсуждение деталей ВыводКак видим, Monkey Job дал развернутый ответ, который может принести практическую пользу, у chat gpt краткий пересказ вместо рецензии и ответ почти не несет практической ценности. БаллыChat gpt 0.25 балла (снизим за то что решена не та задача + за краткость ответа), Monkey Job 1 балл .Итоговая таблица балловИтоговая таблица по всем примерам, преимущество явно у Monkey Job кроме коротких сценариевОбщие ВыводыWeb интерфейс OpenAI дает ответы немного быстрее, чем Monkey Job и лучше подходит для простых и коротких сценариев.Ответы Monkey Job более детальны и поэтому имеют больше практической ценностиСервис Monkey Job лучше решает задачи, связанные с работой с таблицами и ссылками.сервис Monkey Job дает пользователям возможность улучшать запросы и давать больше контекста для еще более качественного решения задачи.ЗаключениеПримеры наглядно показывают влияние качества запросов и количества контекста решаемой задачи на ответы на базе одной технологии. При этом в случае с сервисом Monkey Job не нужно дополнительных усилий для увеличения качества ответов - часть механик уже есть в сервисе "по-умолчанию", а так же кнопка улучшения запросов, в большинстве случаев, помогает найти недостающие детали для запроса, что в конечном итоге приводит к более качественным ответам за то же самое время и позволяет экономить еще больше времени, за счет глубины решения задач и количества покрываемых сценариев.Поэтому я для себя и выбрал Monkey Job в качестве основного GPT инструмента.Напишите пожалуйста в комментариях чем пользуетесь вы, удивлены ли влиянием запросов на качество ответов ?