ChatGPT vs аналитик данных: разбираемся, кто круче

Привет! Меня зовут Миша Серегин, я сооснователь karpov.courses.

Учёные подсчитали, что каждые тридцать секунд в karpov.courses отвечают на вопрос: «Заменит ли ChatGPT аналитиков?» В статье подробно разобрали, что именно делает аналитик и может ли нейросеть выполнить эту работу.

Ещё я приведу реальный пример из своей работы без красивых данных и расскажу про нужный уровень знаний в коде.

Для удобства разделим обычную абстрактную задачу аналитика на три этапа: понимание проблемы, поиск ответа в данных, упаковка решения.

Что будет в статье:

Михаил Серегин
сооснователь karpov.courses

Этап первый: понять, какую проблему нужно решить

Аналитик — специалист по работе с данными. Но это не означает крутить цифры на экране самым сложным из возможных способов. На основе данных аналитик может помочь людям, принимающим решения в бизнесе — ЛПР.

Бизнес-заказчик может плохо понимать, как сформулировать свою потребность и что вообще можно узнать, поэтому основная работа аналитика происходит именно на этом этапе. Аналитик должен понять: «Какая проблема у ЛПР и как могут помочь данные?»

В реальности решение часто уже принято, и аналитик должен его подтвердить, защитить или опровергнуть. Выбор того, вступать ли в конфронтацию с существующим решением, каждый должен принимать самостоятельно.

Чего делать точно не стоит — готовить гигантский дашборд по поводу уже принятого решения. Потому что тогда вы не успеете сделать действительно нужную работу — найти и достать важные для принятия решения показатели. Вытащить даже один может быть сложно.

Иногда данные ничего не говорят о проблеме. Однажды я работал с продуктом, который хотели вывести на рынки США с аббревиатурой STD. Вместо данных нужен был эксперт, который знал, что STD — это Sexually Transmitted Diseases.

На этапе понимания задачи не поможет никакая нейросеть, потому что нейросеть не учили распознавать, что человек на самом деле имеет в виду под сказанным.

Поймите, что беспокоит ЛПР и какой ответ нужно искать

Этап второй: найти ответ в данных

Этот этап технический, и он тоже делится на две части.

Первый шаг — спроектировать решение. Аналитик должен понять, как найти ответ самым быстрым и наименее трудозатратным способом.

Например, компания хочет раздать подарки топовым пользователям. Чтобы определить их, можно собрать данные по всем пользователям или только по тем, кто был онлайн последний месяц. Эти данные лежат в разных базах данных с разной скоростью работы.

Если попросить ChatGPT помочь с проектированием подобного решения, есть риск погрязнуть в объяснениях. Такой запрос будет похож на что-то вроде: «Из первой базы мне нужно достать X-данные, из второй Y-данные. После этого нужно связать их между собой вот таким способом...»

В большинстве случае такую задачу проще сделать самостоятельно, чем полностью прописывать текстом. Многие вещи выражать словами сложно, но в голове мы легко их держим в виде схем.

Чтобы нейросеть посоветовала что-то дельное, придётся объяснять ей всё:

  • Выдать GPT всю информацию о базе, которой чаще всего нет в текстовом виде и которую вам рассказал один из разработчиков.
  • Точно объяснить, что нужно сделать с данными. Тут тоже нужно учесть некоторые тонкости, например, не использовать в прогнозах продаж данные за 8 марта, если вы продаёте цветы.

Спроектируйте решение: куда надо залезть, что посчитать и почему

Реальный пример схемы аналитического решения

Второй шаг — воплотить решение. Написать код, собрать дашборд, сходить к кому-то, чтобы понять, как работает БД или другие сложные вещи, например, геоданные.

После спроектированной логики уже несложно написать самому всё остальное. Обычно достаточно даже общего понимания языка запросов SQL. Это строгий язык, в котором нет сложноподчинённых предложений или тонкостей пунктуации вроде Oxford Comma — поэтому нет риска написать двусмысленное или нечеткое указание.

ChatGPT может помочь с отдельными техническими вопросами. Например, написать регулярное выражение, формулу для поиска слова или фразы в тексте.

Если вы можете сформулировать задачу на естественном языке, сформулировать её на языке программирования будет не сложно

Этап третий: упаковать ответ в понятный вид

Это не самый трудозатратный, но самый ответственный этап. Если на основе ваших данных не будет принято решение, вся предыдущая работа прошла впустую.

Найденный в данных ответ нужно упаковать и донести до ЛПР на понятном ему языке. ЛПР может быть молодым стартапером, матёрым продажником с 30 годами опыта в ритейле или бывшим ML-инженером. На этом этапе аналитик будет руководствоваться жизненным опытом и чутьём, искать подход. Это чисто человеческая работа.

Решение должно иметь удобный вид в зависимости от остальных обстоятельств: обновляемый дашборд, презентация, просто один фактоид. На этом этапе ChatGPT особенно не поможет — хотя он способен накидать идей, которые могут на что-то натолкнуть.

Допустим, поступает задача: составить прогноз пользователей на следующий год. Аналитик обязан понять:

  • Что именно должно быть в этом прогнозе?
  • Какое решение он должен помочь принять?
  • Кто будет смотреть на этот прогноз?
  • Какова цена ошибки?

Итогом хорошо сделанной работы аналитика будет ответ на вопрос: «Что говорят данные об этой проблеме?»

Пример работы аналитика: оцениваем рекламу на маршрутках

Идеальных данных не бывает. Ну, почти.

Когда-то я работал в стартапе, который набирал линейный персонал. Компания запустила наружную рекламу на куче маршруток в разных городах. Нужно было посчитать эффективность рекламы и ответить на вопрос: «Будем ли запускать её снова?»

Что мог бы посоветовать ChatGPT

Давайте представим, что могла бы сказать по этому поводу нейросеть:

Группы «до запуска рекламы и после» называются экспериментальными и контрольными. Но запуск уже случился, поздно что-то придумывать задним числом. Если начать учить CEO дизайну эксперимента, он просто попросит другого аналитика.

Что сделал я: проектирование решения

Первая мысль, которая пришла в голову мне, — выделить контрольную и экспериментальную группы постфактум. Да-да, это очень неправильно и вообще. Но если вы думаете, что основу работы аналитика составляет обработка хорошо подготовленных данных, вас ждёт грустный сюрприз.

Я уточнил детали и выяснил, в каких городах мы давали рекламу.

Потом попробовал объединить все города с рекламой в одну группу и сэмплировать данные из остальных городов, чтобы получить группу, похожую по размеру. После этого начал искать пару каждому городу, в котором была реклама. Получалось это с трудом. Единственная закономерность оказалась в похожести речных городов между собой.

В итоге получилось что-то похожее на контрольную и экспериментальную группы.

Что сделал я: реализация

С технической стороны мне понадобилось:

  • Написать код для сравнения городов.
  • Визуализацию результатов для удобства выбора пары. Я рисовал график в Python. Мне это не нравилось, но было удобнее работать в нём, потому что графиков надо было сразу много.
  • Работать с геоданными. Чтобы понять, как они устроены, я просил помочь разработчиков.
  • Выбрать метод математической статистики, которым я буду сравнивать группы. И тут не было ни одного правильного варианта, потому что это ненастоящие экспериментальная и контрольная группы.

ChatGPT мог бы помочь с кодом для поиска пар городов, графиками или геоданными. Но с уточнениями: близко расположенные друг от друга города (например, подмосковные) для нужд нашей задачи считаются как один. Причина — люди из одного города ищут работу в другом и перемещаются между ними на маршрутках.

Код аналитика: что нужно уметь

Чаще всего код аналитика отрабатывает один раз, и больше им никто никогда не пользуется. Если руководитель делает из своих аналитиков профессионалов-разработчиков, он зря тратит время.

Код аналитика совершенно не похож на код, который пишут разработчики для сервисов пользователей. Такие продукты должны работать чисто и быстро. Запросы в данных могут позволить себе быть во много раз медленнее, если выполняют свою задачу.

Можно подумать, что с быстрым хорошим кодом вы ускорите свою работу. Но основная часть работы проходит на этапе понимания проблемы и упаковки решения. На полное понимание задачи может уйти не один час и даже не день. И гораздо менее важно, сколько выполняется сам код — полтора часа или десять минут.

За время работы придётся разобраться в разных вещах: работа баз данных, другие языки программирования, финансовые нюансы. В большинстве из них не нужно становиться специалистом.

Владение и соблюдение всех практик хорошего кода не делает из вас хорошего аналитика и не гарантирует повышения

Итоги: каких аналитиков можно заменить нейросетью?

Когда аналитик хорошо разобрался в проблеме и понимает, как спроектировать поиск ответа в данных, с отдельными моментами ему очень даже поможет ChatGPT. Но всё же придётся думать своей головой.

Если специалист может понять проблему, найти ответ в данных и донести решение — это как минимум мидл-аналитик. Его никакая нейросеть не заменит.

ChatGPT может решать задачи только на уровне джуна, при этом сделает это быстрее. А значит, уровень сложности задач для новичков через 1–2 года повысится. Поэтому, если хотите начать свой путь в аналитике, не тяните.

0
31 комментарий
Написать комментарий...
Настя

Удивляюсь, когда слышу, что ИИ воспринимают как врага… Мне кажется, он, скорее, помощник

Ответить
Развернуть ветку
Mikhail Seregin

К сожалению, многих изменения пугают!

Ответить
Развернуть ветку
Настя

Конечно!
На каждом углу кричат о том, что все скоро потеряют работу

Ответить
Развернуть ветку
Mikhail Seregin

Если человек очень хочет расслабиться, потому что он обречен — он обязательно найдет для этого повод)

Ответить
Развернуть ветку
Ян Лус

ну можно понять и такое восприятие, потому что люди боятся потерять работу) Да и применяют ИИ в довольно творческих сферах сейчас,а творческим людям их работа нравится

Ответить
Развернуть ветку
Геннадий Горн

помощник , но люди заглядывают на перед и бояться что этот помощник может сместить и заменить их в выполнении обязанностей

Ответить
Развернуть ветку
Анастасия Сеначина

Спасибо!
Очень крутая статья

Ответить
Развернуть ветку
ModernSamurai

так точно сказано про потребности ЛПР! часто сами не знают, чего хотят. если смочь «нащупать» их проблему - сразу +100 к профессионализму)

Ответить
Развернуть ветку
Mikhail Seregin

Я так довольно долго и успешно заменял технические скиллы умением разобраться в хотелках менеджера)

Ответить
Развернуть ветку
Владислав Газинский

О
++++
Технари часто недооценивают софты, а мы делаем это своим преимуществом)

Ответить
Развернуть ветку
Наталья Калинина

по сути GPT расписал этапы для составления аналитики ,но не сделал аналитику за вас, поэтому это отличный инструмент- помощник, но не более

Ответить
Развернуть ветку
Mikhail Seregin

абсолютно точно!

Ответить
Развернуть ветку
hxllx kitty

«Итогом хорошо сделанной работы аналитика будет ответ на вопрос: «Что говорят данные об этой проблеме?»

👏

Ответить
Развернуть ветку
Владлена Миронова

Обычно схемы с аналитикой, как у детективов в фильмах))))

Ответить
Развернуть ветку
Mikhail Seregin

В статье еще не самая страшная!

Ответить
Развернуть ветку
Геннадий Дюженков

🔥

Ответить
Развернуть ветку
Диана Королева

Кстати, стала сталкиваться с обратным:
клиенты обесценивают некоторые задачи, потому что их можно решить с помощью сетки, не учитывая, что ей можно не уметь пользоваться 🙃

Ответить
Развернуть ветку
Продюсер душнила

У меня такая ситуация произошла на прошлой неделе) значит, освоил я наконец гпт и стал регулярно в работе использовать как своего личного джуна. Работа заметно ускорилась, объемы выросли, а качество при этом не пострадало. И как то на созвоне у меня фаундер спрашивает мол, а как ты так один успеваешь, а наши копирайтеры/дизайнеры нет. Я говорю, что юзаю нейросети и понимаю, как добиться от них результата. А он в ответ на серьезных щщах — ну я же нанимал тебя, а не нейросети. Зачем тебе тогда платить столько? Мы тогда сами можем обращаться к сетям.

Ответить
Развернуть ветку
Чечёточник

Фаундер чего? Сети коровников за Уралом?

Ответить
Развернуть ветку
Mikhail Seregin

Всегда можно предложить им в прямом эфире решить свои задачи с ее помощью, посмотреть на результат)

Ответить
Развернуть ветку
Виталий Дуюнов

ну вы классно все описали. только это на момент сейчас. когда технология активно вышла в массы всего год назад. и за год УЖЕ показала что способна быть джуном. а что будет через 3 года? а что через 5?

Если нейросеть умеет уже сейчас писать код. То что помешает запилить нейросеть для решения задач аналитики? грузите в нейронку табличку со своими данными и она вам в разных разрезах их анализирует)

понятно что супер сложные задачи может и не решит, а вот даже уровень мидл аналитика заменит точно. просто время дайте.

P.S.: аббревиатуры неросеть уже хорошо умеет понимать. и в вашем примере про рынок США как раз нейросеть бы это может сразу и подсветила)

Ответить
Развернуть ветку
Mikhail Seregin

линейная экстраполяция динамики роста этого года на последующие пять лет, возможно, не лучшая идея: в конце концов, индустрия уже переживала не одну "зиму искусственного интеллекта".

Ответить
Развернуть ветку
Инна Серова

Я правильно понимаю, аналитика делается до стратегии? Или зависит от целей аналитики? Есть что-то типа «аналитики»?

Ответить
Развернуть ветку
Валера

Что б ИИ дал хороший совет по аналитике, нужен аналитик который даст корректное задание для ИИ.

Ответить
Развернуть ветку
Журнал Проводник

Интересная статья

Ответить
Развернуть ветку
Alexzz

Прочитал про неблагозвучное имя std и понял что автор тупо не спрашивал ничего у чатжпт. Я спросил. Ответ

Naming a product "STD" in the US might not be advisable due to the negative connotations associated with the abbreviation, which commonly stands for sexually transmitted disease. It could potentially lead to misunderstandings, negative perceptions, and may harm the product's reputation or brand image. It's generally recommended to choose a name that doesn't have such negative associations.

Ответить
Развернуть ветку
Mikhail Seregin

А чатгпт сама задумалась про негативные коннотации или все-таки вы ее попросили?)

Ответить
Развернуть ветку
Alexzz

Я попросил оценить название для ИТ продукта в США. Это банальная задача для вывода любого продукта на новый рынок. Попросил словами - хау Гуд из Зе гейм .....а вы этого не делали. Зато написали статью

Ответить
Развернуть ветку
Mikhail Seregin

Напишите тоже!

Ответить
Развернуть ветку
Kate Leonenko

раньше нам нужны были аналитики, теперь нужны аналитики по ИИ))

Ответить
Развернуть ветку
Dmitry Novikov

Вводящий в заблуждение заголовок.
Плохая практика.

Ответить
Развернуть ветку
28 комментариев
Раскрывать всегда