AI: Скоро грядет полная замена аналитиков, или еще рано?
В последнее время я часто слышу тезисы о скорой полной замене аналитиков искусственным интеллектом (ИИ), особенно в хвалебных отзывах о возможностях нейросетей. Периодически появляются статьи и новости, сообщающие о преодолении очередного “рубикона” в развитии нейросетей, и предсказывающие скорый уход большинства специалистов с рынка. Из-за этого сейчас развернулась настоящая ИИ-гонка между крупными корпорациями, которые соревнуются в создании самой умной нейросети. Зарплаты в этой области достигли исторических максимумов, что свидетельствует о том, что тема ИИ раздута до невероятных масштабов.
Давайте разберем, как я использую эти “сверхумные” модели и на что они действительно способны, на примере всем известного GPT.
GPT-модели: кратко о возможностях
GPT легко обрабатывают огромные объемы данных, создают сложные визуализации и генерируют отчеты с невероятной скоростью. Они не только автоматизируют рутинные задачи, но и способны выявлять скрытые закономерности, на что у традиционных аналитиков уходят месяцы.
В связи с этим возникает закономерный вопрос: а нужны ли теперь специалисты, если GPT может выполнять их работу лучше и быстрее?
Может быть, пора начинать бунты и бойкотировать подобные инновации, подобно луддитам в Англии XIX века? (https://ru.wikipedia.org/wiki/Луддиты)
Автоматизация с GPT на практике:
GPT может быть полезен в следующих сценариях:
- Автоматизация отчетности: Допустим, вам нужен ежедневный отчет о продажах по каждому региону. Вместо ручного составления отчета из нескольких источников данных и создания графиков, вы можете задать GPT следующий запрос:“Сгенерируйте отчет о продажах за вчерашний день, включающий данные по каждому региону (Восток, Запад, Север, Юг), с указанием количества проданных единиц и выручки. Представьте данные в виде таблицы и столбчатой диаграммы.”GPT сгенерирует отчет, значительно сокращая время на рутинную работу.
- Предобработка данных: Представим, что у вас есть набор данных с пропущенными значениями и непоследовательными форматами дат. Вместо ручного заполнения и преобразования данных, вы можете дать GPT команду:“Очистите данные в файле ‘data.csv’. Замените пропущенные значения в столбце ‘цена’ средним значением, а в столбце ‘дата’ исправьте формат на YYYY-MM-DD.”GPT выполнит предобработку, экономя время и уменьшая риск ошибок.
- Генерация кода: Нужно написать несложный SQL-запрос для извлечения данных из базы данных? Забудьте о долгих поисках правильного синтаксиса! Просто задайте GPT следующий запрос:“Напишите SQL-запрос для извлечения данных о клиентах, совершивших покупки на сумму свыше 1000 рублей в период с 1 января по 31 марта 2024 года, включая их ID, имя, email и сумму покупок. База данных – MySQL.”GPT сгенерирует эффективный и корректный код.
- Первичный анализ текстовых данных: Вам нужно проанализировать 500 отзывов клиентов? GPT поможет:“Проанализируйте предоставленные отзывы клиентов (прикреплен файл ‘reviews.txt’) и определите три основные темы, выделив положительные и негативные упоминания для каждой темы.”GPT быстро выявит ключевые темы и сэкономит вам часы ручного анализа.
Реальные примеры: измеримое ускорение работы
Пример 1: Автоматизация ежемесячного отчета по маркетинговым кампаниям.
среднем, подготовка такого отчета занимает 2 дня (16 часов).
Проблема заключалась в сборе данных из различных источников (ERP-система, CRM-система, внутренняя база данных) и их согласовании.
Использование GPT для генерации текста отчета, запроса данных из разных источников и создания графиков, сократило время до 4 часов (75% экономия). При этом, можно провести сравнение с “ручными” отчетами.
Это особенно удобно для компаний, где для анализа до сих пор используют Excel со связкой источников через “ВПР”.
Пример 2: Сегментация клиентов на основе анализа отзывов.
нализ 10 000 отзывов вручную занял бы неделю.
Проблема заключалась в большом объеме текста и необходимости выделить ключевые темы и эмоции.
Запрос к GPT:“Проанализируйте 10 000 отзывов клиентов (прикреплен файл ‘customer_reviews.csv’) и классифицируйте их по тональности (положительная, отрицательная, нейтральная). Выделите 5 ключевых тем и сгруппируйте клиентов по сегментам на основе этих тем.”GPT классифицировал отзывы за 3 часа (более 90% экономии времени).
Это позволило быстро идентифицировать ключевые проблемы (например, низкое качество обслуживания) и разработать целевые маркетинговые кампании, которые привели к 15% росту продаж в целевом сегменте, что подтвердилось A/B тестированием.
Пример 3: Разработка сложного ETL-процесса для миграции данных.
оздание скрипта для извлечения, преобразования и загрузки данных (ETL) обычно занимает несколько дней из-за сложности кода и обработки ошибок, а также необходимости глубокого понимания бизнес-процесса.
Проблема заключалась в написании надежного и эффективного кода на Python. Используя GPT для генерации фрагментов кода (включая обработку исключений и логирование) и документации, время разработки сократилось в два раза.
Запрос:“Напишите Python-скрипт для ETL-процесса: извлечение данных из CSV-файла ‘source.csv’, преобразование данных (замена значений, изменение типов данных) и загрузка данных в базу данных PostgreSQL. Учтите обработку возможных ошибок и добавьте логирование.”
Тестирование также сократилось на 40% благодаря более четкому и структурированному коду.
Пример из моего опыта: В 2023 году, работая над проектом, я активно использовал GPT для написания SQL-запросов для базы данных Firebird. Проблема заключалась в сложности синтаксиса Firebird и поиске нужных функций. GPT генерировал сложные запросы за секунды, что позволило сократить время разработки более чем на 50% и ускорить внедрение решений в 2 раза.
Кажется, это идеальное решение. Зачем же тогда человек для работы с данными?
Пример: как можно быть обманутым GPT
Представьте, что вы собираете статистику маркетинга после проведения акции и рекламы на протезирование зубов. GPT выводит результат, показывающий, что приток новых клиентов составил 150%, но не по той услуге, которую вы рекламировали. В лидеры по популярности выбилось комплексное обследование полости рта.
В такой ситуации легко поддаться искушению немедленно перенаправить маркетинговые усилия на новую услугу и сделать условия ее предоставления более привлекательными, основываясь на кажущемся “бешеном” спросе.
Однако, если забыть о контексте отчета (например, о том, что перед запуском акции не уточнили наличие протезов на складе, а стоматолог-хирург находится в отпуске), можно совершить серьезную ошибку. В итоге, клиенты, пришедшие на протезирование, получают комплексное обследование, поскольку протезы отсутствуют, а хирург в отпуске.
Хотя запуск маркетинговых активностей обычно включает в себя длительное согласование бюджетов и возможностей, этот пример показывает, как легко допустить ошибку в выводах, опираясь на “голые” цифры без учета бизнес-контекста.
Слабые стороны GPT: где человек выходит в лидеры (но не каждый)
GPT демонстрирует значительный потенциал, но его функциональность ограничена зависимостью от данных обучения и отсутствием способности к самостоятельному суждению. GPT не умеет:
- Понимать нюансы: Однажды GPT анализировал отзывы о новом продукте и выделил большое количество негативных отзывов, включая ироничные комментарии довольных клиентов. Человек должен проверить результаты и отфильтровать ироничные отзывы.
- Понимать "полет фантазии".: Как часто мы получаем понятную задачу от бизнес-пользователя? Как правило, они выражают свои пожелания в формате “полета фантазии”, и для формулирования четкой задачи требуется глубокое понимание бизнес-процессов.
- Выявлять скрытые корреляции: GPT обнаружил корреляцию между продажами и температурой воздуха, но не смог уловить более сложную взаимосвязь, а именно влияние рекламной кампании, которая была запущена в период повышения температуры. Здесь потребовалась экспертиза человека.
- Проверять достоверность данных: GPT сгенерировал отчет, основанный на некорректных данных из устаревшего источника. Это подчеркивает необходимость проверки данных перед использованием результатов GPT.
- Принимать сложные решения: GPT предложил несколько вариантов решения проблемы, но окончательное решение, учитывающее бизнес-контекст и риски, должен принимать человек.
Основные советы по эффективному взаимодействию с GPT
Эффективность работы с GPT напрямую зависит от точности формулировки запросов. Вот несколько советов:
- Четко формулируйте свои запросы: Вместо “дай мне данные о продажах”, лучше: “Предоставь данные о продажах продукта X за период с 01.01.2024 по 31.03.2024, разбитые по регионам и каналам сбыта, в формате CSV”.
- Используйте ключевые слова: Вместо “информация о клиентах”, используйте “список клиентов с указанием ID, даты регистрации, суммарных покупок за последний год и среднего чека”.
- Экспериментируйте с разными формулировками: Если “Напиши отчет о продажах” не сработало, попробуйте: “Напиши краткий отчет о продажах за прошлый месяц, включая общую сумму, количество проданных товаров, средний чек и конверсию”. Иногда даже незначительное изменение формулировки приводит к значительно лучшему результату.
- Указывайте контекст: Для более точных результатов предоставляйте достаточно контекста. Укажите название проекта, тип данных, используемые инструменты и т.д.
- Используйте итеративный подход: Не ожидайте идеального ответа с первого раза. Задавайте уточняющие вопросы, вносите коррективы и постепенно доводите результат до совершенства.
- Проверяйте результаты: GPT может допускать ошибки. Критическое мышление и самостоятельная проверка результатов остаются важными.
- Экспериментируйте с различными функциями: GPT может помочь с переводом текста, резюмированием, написанием кода и многим другим.
Заключение
Миф о полной замене аналитиков искусственным интеллектом – это, мягко говоря, преувеличение. GPT отлично справляется с множеством задач, автоматизируя составление отчетов, генерацию SQL-запросов и визуализацию данных. Но все это лишено понимания бизнес-логики и глубинного контекста.
Однозначно, использование GPT значительно снижает нагрузку и автоматизирует рутинные задачи. Но что касается принятия реальных решений и действий в бизнесе на основе отчетов GPT, то здесь однозначно необходим человеческий контроль.
В идеале, рядом с GPT нужно настроить автоматический парсер данных из БД, а затем автоматические сверки значений в полученных отчетах. Это позволит убедиться, что цифры не врут.
Таким образом, как отдельный “игрок” в компании, GPT - это не более чем умный поисковик. Однако, в правильной синергии с человеком, его работоспособность выходит на новый уровень.
Чтобы собрать подобные истории и сравнения воедино, и иметь возможность использовать их как памятку, я создал Telegram-канал “Data Дзен с Олегом Дмитриевым” , где простым языком рассказываю о подходах к решению аналитических кейсов, разбираю ошибки в UX-дизайне и делюсь мемами о любимой работе.
Присоединяйтесь, чтобы вместе разбираться с проблемами анализа данных, и не забудьте поделиться как вы используете AI в своей работе уже сейчас!