{"id":14291,"url":"\/distributions\/14291\/click?bit=1&hash=257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","title":"\u0420\u0435\u043a\u043b\u0430\u043c\u0430 \u043d\u0430 Ozon \u0434\u043b\u044f \u0442\u0435\u0445, \u043a\u0442\u043e \u043d\u0438\u0447\u0435\u0433\u043e \u0442\u0430\u043c \u043d\u0435 \u043f\u0440\u043e\u0434\u0430\u0451\u0442","buttonText":"","imageUuid":""}

Тестируем ChatGPT Code Interpreter на реальных бизнес-задачах

Меня зовут Андрей Цыган — я не программист, я смотрю на технологии ИИ с точки зрения человека, кто знает, что хочет, но не имеет навыков это сделать через код.

ChatGPTуже мог дать формулы для Excel, или рассказать по шагам как нужно делать - но делать приходилось самому - и это было самое слабое звено.

Это было похоже на знаменитый мем (а может и реальную историю):

Но с новым плагином Code Interpreter правила игры поменялись. Теперь он не рассказывает как, а теперь он делает. И выглядит это для некодеров фантастически!

Мало того что выглядит, мне кажется это кардинальная смена правил игры - многие приложения, удобные, классные, могут претерпеть коренные изменения.

Так как "в обозримом будущем" вполне реально что не надо будет интерфейса, мануалов - просто скажи что ты хочешь, и ты это получишь.

Конечно не всё, но скорость доработок меня впечатляет!

Я на личном опыте увидел как человек может "перескочить" уровни взаимодействия с интерфейсом. Бабушка, 74 года, кнопочный телефон, никаких планшетов (тыкать пальцем куда то не хотела никак),про ютуб не слышала. Но когда приезжает в гости она знает - надо просто сказать "Алиса, поставь мне концерт Надежды Кадышевой где она с молодым баянистом в Витебске" - и все! Так может получится и тут.

Что будет в статье:

  • Построение аналитики (таблицы, графики, диаграммы) из Excel - анализ рынка
  • Построение аналитики по данным из CRM
  • Распознавание текста счетов
  • Работа с аудио, видео
  • Работа с презентациями

Что такое Code Interpreter?

Code Interpreter - это плагин от OpenAI для ChatGPT. Он позволяет создать и запустить код прямо в интерфейсе, и умеет работать с загруженными файлами.

Долгое время он был в закрытом тестировании, но уже сейчас он становится доступен простым смертным, по подписке Plus (20USD в месяц). Работает он с моделью GPT-4

Подключаем его в настройках.

Если у Вас не появилось, то обещали всем до конца недели дать доступ

Далее в окошке модели выбираем GPT-4 Code Interpreter

Загрузка файлов

Теперь у нас появилась возможность загружать файлы размером до 100 мб.

Загрузка файлов работает только в этом режиме

Это могут быть ваша база данных, ваши расчёты в Excel, pdf файлы, медиа файлы. В общем - 100 мб вполне есть куда развернуться.

Но это всё лирика, главный вопрос “что мне с этого, что с этим можно сделать?”.

Я протестировал несколько реальных задач, уверен в ближайшее время мы увидим сотни крутых кейсов. Пишите в комментариях ваши кейсы - буду благодарен.

Все примеры я буду показывать реальные, из бизнеса (малый бизнес). У больших корпораций наверное другие запросы - ну и другие ресурсы.

Анализ данных

В малом бизнесе у вас может не быть колл-центра, отдела маркетинга, и даже иногда продаж, но всегда будут налоги и Excel. Начнём со второго.

В целом зачастую все наши небольшие данные помещаются в Excel - это и метрики по рекламе, выгрузка с CRM, банковские движения.

Это думаю будет один из самых популярных кейсов

Анализ рынка

Для теста возьмём открытые данные. Мы в компании "Изи-Штандарт" занимаемся вопросами сертификации, сейчас рынок упал - и вполне резонный вопрос, а в каких странах есть ещё этот рынок. Решим эту задачу

У ISO есть ежегодный отчёт по количеству действующих сертификатов в разрезе стран и стандартов. Скачиваем и загружаем в него файл, без подготовки. Это обычный Excel файл.

Дай мне количество сертификатов по русскоязычным странах по стандартам, и посчитай общее количество выданных сертификатов как по стандарту так и по стране

Очень простой запрос, без подготовки и промт-инжиниринга

Все запросы я писал очень простым языком, именно "вот надо это,и всё". Сам посмотри колонки, сам пойми где какие данные. Я пытался эмулировать позицию пользователя, есть данные - хочу ответы в виде график и диаграмм.

Он сам посмотрел данные, немного причесал, уточнил страны и вуаля

Вот такие данные мы получаем через минуту ( сначала он смотрит данные, пробует, размечает) а потом достаточно быстро строит нужные выходные данные.

Просим из таблицы сделать вертикальную диаграмму по стандарту ISO 9001

Пример вертикальной диаграммы

Цвета и оформление можно задавать. Попросим сделать тепловую диаграмму

В каждую страну можно углубляться дальше

А вот и топ-10 отраслей по стандарту ISO 9001 из Беларуси

Названия на англ забирает из датасета

По словам ChatGPT он может строить такие виды диаграмм (но что то мне подсказывает, что скоро умные люди найдут способ расширить этот список):

  • Линейные графики (Line plots): используются для визуализации данных во времени (так называемые "временные ряды") или для отображения взаимосвязи между двумя наборами данных.
  • Столбчатые диаграммы (Bar plots): используются для сравнения величин разных категорий или групп.
  • Гистограммы (Histograms): используются для визуализации распределения одномерного набора данных.
  • Точечные диаграммы (Scatter plots): используются для визуализации взаимосвязи между двумя наборами данных.
  • Ящики с усами (Box plots): используются для визуализации статистических свойств распределения данных (медиана, квартили, выбросы и т.д.).
  • Круговые диаграммы (Pie charts): используются для отображения пропорций различных категорий в общем количестве.
  • Тепловые карты (Heatmaps): используются для визуализации матрицы данных, где цвет каждой ячейки соответствует значению в этой ячейке.
  • Графики ошибок (Error bars): используются для визуализации неопределенности или вариации данных.

Эти данные можно сразу попросить сделать в PDF или PPT

Я трудился над этим анализом всю неделю, срочно нужна премия!

Резюме по анализу данных:

Мы можем быстро получать ответы на вопросы из любого Excel - несколько листов, связанные данные и получить в виде диаграмм и графиков ответ. Он сам проанализирует содержание, и иногда задаёт вопросы. Как быстро теперь пойдут "анализы рынков")

Анализ данных из CRM

У нас есть CRM - AmoCRM,и из неё мы можем выгрузить в excel список сделок со всеми полями. Да,в CRM есть аналитика, но на некоторые вопросы она не даёт ответа, или не тот вид. Давайте попробуем решить эти задачи через ChatGPT.

Файл получился очень большой - у нас более 400 полей, он немного ругается и просит сократить поля - но мы не хотим работать - эту работу поручаем ему. И он кстати умеет очень быстро менять данные - идеально для презентаций)

Я злой и ленивый постановщик задач)

Просим его построить графики и диаграммы по нашим данным.

Так себе конечно картина, но выше ищем как преломить линию)

Резюме по CRM аналитике

Он может работать с большим количеством полей, отлично понимает смысл ваших полей (может уточнить) и даст ответы на ваши вопросы. Главное - чтобы у вас были структурированные эти данные.

Работа по распознаванию PDF счетов

Накладная, счёт, акт - мы их в бизнесе получаем море,и нужно ручками вносить в нашу систему платежей - кому, за что,и сколько платить.

Давайте попросим распознать текст, и выделить платёжные данные.

Очень простой запрос

Возьмём даже не самый простой вид счёта, это больше счёт-договор. Есть и текстовая часть, и табличная. Наша задача - получить кому платить, сколько платить, и за что платить

Загружаем файл и просим, по-простому, по-людски, дать данные:

Он может вернуть данные в любом формате: для дальнейшей выгрузки в систему

Единственное НО - с русским языком пишет что не умеет работать,нету библиотеки(

Работа с аудио

Распознать текст с аудио ни на русском, ни на англ у меня не получилось. Уверен можно подсказать библиотеки и может он сможет что то лучше, но я знаю только одну библиотеку- им. Ленина.

Но он может делать простые процедуры - порезать, к примеру, аудио на нужное количество частей (с максимальным размером и длительностью) Это может быть нужно к примеру, когда какое нить приложение не берет большой файл, и нужно его разбить.

Например Whisper, которым мне удалось попользоваться, кушает файлы только до 18 минут, и было неудобно разбивать длинные видео на эти куски. Теперь это просто

Можно ставить и по длительности, и по мб

Работа с изображениями

Я попробовал писать текст на изображение, но в такой формулировке он совсем отказался.

Опять советы как сделать, а мне бы сделать

Но если изменить задачу на "нанеси watermark" - он пишет. Немного ругается про шрифты, но пишет. Очень мелким шрифтом пишет, даже ему указывал размер шрифта, но он сказал пока могу так. Но уже МОЖЕТ!

В правом верхнем углу написал

В целом простые моменты с изображением может делать - поворот, разворот, изменение формата.

Работа с видео

Он умеет преобразовывать GIF to MP4, делать простые обработки видео, типа "зум",и создавать GIF

В твиттере Riley Goodside есть примеры работы с видео.

Я попробовал решить задачу, с которой недавно возился в CapCut. Сделать равномерное видео по картинке (слайду). Он выполнил и эту задачу, вот результат:

Панорамное видео от ChatGPT в 1 клик

Он может добавить аудиодорожку, опять же - вырезать, разрезать

Работа с презентациями

Мы же сделали много графиков, может ли он сразу сделать нам презентацию.

Спойлер: фактически может, но она будет без оформления.

Путём эксперимента мы поняли возможности по созданию презентаций:

  • Понимает заголовок и контент
  • Цвет шрифта
  • Стандартные макеты слайдов
  • Вставить изображение

Вот несколько примеров

В целом, можно создать презентацию на основе полученных графиков - но руками до человеческого вида придётся доработать.

Резюме

Лично для меня этот плагин стал открытием "ящика Пандоры". Главное - запрос - не только инструкция - а готовый результат. Я думаю это может пошатнуть позицию некоторых утилит - теперь можно будет делать многие вещи внутри chatgpt.

Он мне часто отвечал что у него нету той или иной библиотеки - я с удовольствием представляю, как заиграет этот плагин если в него можно будет загружать нужные библиотеки

Меня зовут Андрей Цыган, я предприниматель и исследователь. Уже более 5ти лет плотно занимаюсь вопросами построения бизнес-процессов, автоматизации и цифровой трансформации бизнеса.

Мои бизнесы:

  • Помогаем получить международные сертификаты,такие как ISO, CE в любой точке мира и на любую продукцию - "Изи-Штандарт"
  • Автоматизируем процессы на базе amoCRM и BPM-платформы Sensei - Pushka Lab

В последнее время активно исследую возможности и полезность нейросетей для бизнеса.

Часто выступаю на тему ИИ и нейросетей - стараюсь пояснить фундаментальные вопросы и принципы работы простым языком. Выступления появляются тут.Меня всегда можно найти в FB* или Insta*

Напишите в комментариях - какие ещё кейсы применения Code Interpreter вы придумали, или хотите чтобы я протестировал.

*Meta, которой принадлежит Instagram и Facebook, признана в России экстремистской организацией

0
2 комментария
Alexandr Sosnovsky

Очень круто. Конечно, надо тестить на своих задачах. Но идеи, примеры и описание и стиль подачи - пушка.

Ответить
Развернуть ветку
Андрей Цыган
Автор

excel есть у любого.
Но думаю это ещё только начало, мы откопали список библиотек, которыми он располагает, там более 500 библиотек, будем дальше исследовать

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда