Продвинутый анализ данных: быстрее, проще, дешевле
Аналитика не для всех
Подавляющее большинство компаний считают, что сегодня наиболее важные для бизнеса задачи связаны с продвинутой аналитикой: прогнозирование, оптимизация, сегментация, скоринг и подобные. Однако решение этих актуальных и нетривиальных задач так и не стало массовым.
Убедиться в этом несложно — достаточно пообщаться с аналитиками, которые каждый день решают эти задачи, используя очень простые методы решения. Если прогнозирование — то скользящее среднее, если сегментация — то делим по полу и возрасту... Все остальное время уходит на подготовку отчетов.
Вокруг машинного обучения и нейросетей много информационного шума, который мешает сделать правильные выводы относительно реального положения дел в большинстве компаний. На автомобильных выставках большинство посетителей интересуется концепт-карами, про них больше всего статей в автомобильных журналах... Но количество информации совершенно не соответствует тому, что мы видим каждый день на улицах: многие мечтают иметь автомобили будущего, но мало кто может это себе позволить. И это никому не мешает обсуждать достоинства Bugatti Veyron.
Сложность инструментов — важный фактор, сдерживающий массовое применение продвинутой аналитики. Казалось бы, при наличии бесплатных Python или R, любой бухгалтер или маркетолог должен самостоятельно писать скрипты и ежедневно их использовать. Но этого не происходит, потому что кривая обучения любому языку программирования слишком крутая, и большинство людей применяет другие более простые инструменты.
Задачи продвинутой аналитики актуальны, важны и интересны, но порог входа слишком высокий. Опытные специалисты в предметных областях, отлично разбирающиеся в бизнесе, используют привычные электронные таблицы не потому, что считают их лучшими, а потому, что это быстрее и проще.
Слишком круто для слишком многих
Продукт, претендующий на право стать ежедневным инструментом миллионов людей, должен иметь не крутую, а пологую кривую обучения. В этом случае даже минимальные знания позволяют пользователю получать результаты быстро, а каждая следующая небольшая порция знаний открывает новые возможности.
Это повышает мотивацию и вовлеченность, позволяет почувствовать пользу от выполненной работы здесь и сейчас. Кроме того, пологая кривая обучения стимулирует коллег присоединиться к тем, кто уже использует продукт, и тоже начать применять его для регулярной работы. Продукт, который проще в два раза, будет популярнее в 10-20 раз.
Помимо пологой кривой обучения массовый инструмент продвинутой аналитики должен помогать достаточно быстро обрабатывать большие объемы данных. Во-первых, потому, что компании действительно аккумулируют все больше информации. Во-вторых, для маленьких объемов данных есть Excel, который знают все поголовно. Для того чтобы человек потратил время на изучение чего-то нового, нужны сильные доводы.
Порог входа для начала использования Excel очень низок, в результате именно он является самым распространенным инструментов аналитика. Excel, конечно, решает не все задачи, но если его возможностей достаточно, то пользователь не будет изучать что-то дополнительно. Это рациональное решение: зачем тратить дефицитное время на изучение нового, если задачи достаточно хорошо решаются уже знакомым инструментом?
Однако аналитики все чаще сталкиваются с тем, что Excel или вообще не позволяет обработать нужные объемы данных, или делает это слишком медленно. Именно поэтому у них возникает потребность в инструменте, с помощью которого можно обработать много данных, и аналитики готовы потратить время на его изучение. Объемы обрабатываемых данных — самая явная, но не единственная проблема при попытке применения Excel для решения задач продвинутой аналитики.
Кроме того, необходимо учесть еще один неочевидный фактор в пользу простого аналитического инструмента. Продвинутая аналитика предполагает решение нетривиальных задач. Как следствие, далеко не всегда пользователь уверен, что задача будет решена с приемлемым для него результатом: могут возникнуть проблемы с качеством данных, точностью прогноза, нестабильностью решения и прочее. А значит, можно потратить много времени и не получить желаемый результат.
Продвинутая аналитика — это не построение отчетов. Она предполагает выдвижение гипотез с последующей попыткой их доказать или опровергнуть. Проблема в том, что только после проведения эксперимента можно понять, насколько работоспособна гипотеза. До начала анализа это сделать сложно, а желающих тратить время на изучение продукта и эксперименты с негарантированным результатом — немного.
Раздаем продвинутую аналитику. Бесплатно
Для людей, которые чувствуют потребность в продвинутой аналитике и сталкиваются с описанными выше проблемами, есть решение, позволяющее с минимальными усилиями начать знакомство с новыми технологиями, — бесплатная редакция аналитической платформы Loginom Community Edition. Она предназначена для некоммерческого применения, при этом не налагает каких-либо ограничений по времени работы или объему обрабатываемых записей.
Эта система позволяет решать широкий спектр задач продвинутой аналитики: консолидация данных, сегментация клиентов, прогнозирование, оптимизация запасов, визуализация. При этом Loginom — это low-code платформа с пологой кривой обучения. Почти все в нем можно сделать при помощи визуального проектирования, не написав ни единой строчки кода.
Бесплатная редакция Loginom обрабатывает большие массивы данных благодаря расчетам в памяти и параллельным вычислениям. Программа обладает асинхронным пользовательским интерфейсом, т.е. при выполнении долгих расчетов пользователю не нужно ждать их завершения — он может продолжать работу в системе.
Мы предоставляем Loginom вузам для обучения, поддерживаем преподавателей и совершенствуем академическую программу. Развиваем наше комьюнити: готовим видео, статьи, демопримеры. Проводим Хакатоны, где студенты решают реальные бизнес-задачи. Таким образом, мы стремимся привить любовь к анализу данных у будущих специалистов.
А с 9 по 13 ноября 2020 года мы проводим пятидневную online-конференцию Loginom Days, где покажем новые фишки платформы и продемонстрируем кейсы компаний, внедривших продвинутую аналитику в свой бизнес-процесс. Регистрируйтесь и узнайте, как прокачать Data Science без программистов.
Успех — штука непредсказуемая. И если вы думаете, что всех успешных решений можно уложить в план по пунктам — приготовьтесь к пробоине в логике. Даже лучшие стратегии будут бесполезны, если случай решит иначе.
В этой статье поделюсь опытом моей компании о сотрудничестве с агентством недвижимости, продающего самые дорогие объекты России. Расскажу правду о устройстве рынка недвижимости, о том как мы вывели компанию на поток лидов и крутую прибыль, а получили вместо благодарности хейт и слухи за спиной.
Ненавижу копирайтинг. Тот самый "правильный" копирайтинг, которому учат на курсах за 50 тысяч. С его формулами AIDA, болевыми точками и призывами к действию.
ЦБ оставил ключевую ставку 21%, сигнал дал умеренно жёсткий, так что и вся неделя получилась жёсткой. Рубль тоже жёсткий, никак не обмякнет. В акциях, облигациях и крипте всё спокойно, а вот недвижка продолжает пробивать обратное дно. Новые максимумы рисует, ещё и льготные ипотеки расширяют. Из позитивного можно выделить новые дивиденды, ну и наш с…
Администрация Дональда Трампа сделала ход, которого от нее давно ждали, но все равно удивились: впервые наказала Китай за покупку нефти, попавшей под американские санкции.
Короче, в какой-то момент каждому из наc кажется что Солнце как-то не так заходит за горизонт и нужно «заменеджерить» закат вручную. На уроне государства это называется - реформа, а в корпорации - управляемые изменения.
Посетила салон «Точка красоты» на Ленинском просп., д 109 (ТРЦ «РИО», 3 этаж) и получила обрубки на голове, хамство администраторов и игнорирование закона РФ от владельцев данного заведения. В статье расскажу, как я пыталась вернуть деньги за некачественную услугу и чем это закончилось.
Ключевая ставка и последствия. Стоит ли покупать 10-летние ОФЗ. Лидеры роста и снижения. Лучшие облигации. Недвижимость выросла в долларах на 27% за год. Спасибо рублю, а не бетону
А на сколько большие объемы данных можно использовать?
Десятки миллионов - легко. Сотни миллионов - нормально. Больше тоже можно, но для комфортной работы придется использовать некоторые ухищрения, типа сэмплинга или параллельных расчетов, т.е. уже не совсем решения в лоб. При этом код писать не придется.
Loginom хорошо утилизирует железо, поэтому чтобы почувствовать всю мощь хорошо бы его установить на компьютер посерьезнее.