Лого vc.ru

Как спрогнозировать годовую выручку от группы пользователей при помощи Excel

Как спрогнозировать годовую выручку от группы пользователей при помощи Excel

Международный маркетинговый аналитик Gett Алексей Куличевский опубликовал в своём блоге на Medium статью о том, как спрогнозировать годовую выручку когорты по первому месяцу её существования. Редакция vc.ru публикует материал с разрешения автора.

Поделиться

Я уже рассказывал о том, почему важно считать LTV, и как использовать метрику для планирования рекламных бюджетов.

Главная проблема LTV в том, что на сбор данных требуется время, которого обычно нет. Например, вы в течение месяца тестировали новый рекламный канал, и теперь вам нужно решить, продолжать или нет. За месяц покупок было немного, канал еще далек от точки безубыточности, но вы готовы вкладывать, если будете знать, что за год клиенты окупятся.

Сегодня я расскажу, как прогнозировать годовую выручку когорты по первому месяцу её существования. Для прогноза будем использовать линейную регрессию.

Вам понадобятся:

  • Excel (Google-таблицы тоже подойдут, но там немного другой интерфейс);
  • исторические данные о продажах (на них будем обучать модель).

Если вдруг ваш бизнес молодой, и данных за год пока нет,  — ничего страшного. Постройте прогноз на тот период, за который данные есть.

Итак, начнем.

Шаг 1: достаньте данные

Для этого упражнения я подготовил специальный файл, на котором вы можете потренироваться. Скачайте его и откройте в Excel.

Позже попросите программиста выгрузить ваши данные в таком же формате. Покажите этот файл как пример.

Шаг 2: посчитайте выручку на каждого пользователя

Когорты, в которых больше людей, скорее всего, принесут больше денег просто потому, что там больше людей. Единственный вывод, который вы сделаете из модели: «нужно больше покупателей». Не очень полезно. Вместо этого спрогнозируем среднюю выручку с покупателя. Для этого поделим итоговую выручку с когорты на количество людей.

Шаг 3: постройте график

Начинается самое интересное. Чтобы построить модель, нужно понять, как взаимосвязаны данные. Для этого построим scatter plot (такие графики мы все в школе строили).

Каждая точка на графике  — одна когорта. По оси X  —  выручка за месяц. По оси Y —  выручка за год.

На графике видна сильная и весьма логичная линейная зависимость: люди, принесшие больше за первый месяц, скорее всего, принесут больше и за год.

Вопрос в том, насколько больше?

Шаг 4: строим модель

Мы всего в паре шагов от победы. Добавьте на график линию тренда. И не забудьте вывести на экран формулу графика.

Получившаяся формула  —  и есть нужная нам модель. Напомню, что Y  —  LTV за год, а X —  LTV за первый месяц. То есть:

LTV за год = 4.67 * LTV за месяц — 0,72

«Леша, ты хочешь сказать, что можно вот так вот спрогнозировать выручку за год с помощью сложения и умножения? Не может быть!»

Именно так. Но мы еще не закончили. Остался последний шаг.

Шаг 5: оцениваем точность модели

Под формулой есть показатель R^2. Он показывает, насколько хорошо модель описывает имеющиеся данные. 0,93 означает «чертовски хорошо описывает».

Но нам гораздо интересней знать, с какой точностью модель прогнозирует будущее.

Скажу сразу, моделей со 100% точностью не бывает. Вообще.

Чтобы оценить точность модели, разделим имеющиеся данные на 2 группы: обучающую и тестовую.

Обучающую группу пометим нулем, тестовую  —  единицей.

На основе обучающей группы построим модель: добавим график с линей тренда и получим формулу.

Формула немного изменилась. Это нормально.

LTV за год = 5 * LTV за месяц  —  1.72

Теперь применим формулу для прогноза на тестовой выборке.

На графике голубая линия  —  реальный LTV каждой когорты, а оранжевая  —  прогноз, результат работы модели. Смотрите, как они близко.

В статистике используют специальный показатель MSE, сводящий точность модели к одной цифре. Но чтобы не перегружать вас в одной статье, предлагаю почитать про него на «Википедии».

***

Вернемся к тому, зачем мы все это делали.

Напомню, что вам нужно принять решение, продолжать ли рекламную кампанию.

Допустим, что за месяц вы потратили $10 тысяч и привлекли 600 новых пользователей. Эти пользователи за месяц принесли $2400 выручки.

Стоимость одного пользователя = $10000/600 = $16,7

LTV за первый месяц = $2400/600 = $4

Подставим значения в модель:

LTV за год = 5 * $4  —  1,72 = $18,28

Прогнозный ROMI = $18,28/$16,17 = 113%.

Похоже, что рекламная кампания за год не только окупится, но и принесет небольшую прибыль. Если вас устраивает этот результат, смело продолжайте рекламироваться.

P. S. Естественно, периоды 30 и 365 дней можно менять на любые другие. Я, например, часто прогнозирую первый месяц по первому дню.

Присылайте собственные кейсы, в результате которых вам удалось заметно улучшить (или, наоборот, ухудшить) показатели проекта, на what@growthhacks.ru. Интересные эксперименты обязательно попадут на страницы рубрики Growth Hacks.

Популярные статьи
Показать еще
Комментарии отсортированы
как обычно по времени по популярности

Спасибо! как раз этим и занимаюсь

0

Отлично. Статья о том, как построить линию тренда.

0

Хотя, что еще ожидать от человека, называющего числа цифрами.

Соглашусь, что статья абсолютно безобразна. Не понимаю, как такое пропускают.

13% доходность - неплохо, чуть выше, чем у депозита в среднестатистическом росс. банке. И да, было бы неплохо продисконтировать выручку, все-таки некий уровень неопределенности существует

0

Я себе немного по-другому представлял Data Science

Спасибо. Ничего не понял, но в закладки положил. Шучу. Но вот в свою версию добавлю сезонность, динамику тренда и прочее.

0

Классная тема, нечто похожее делаю, но всегда как-то жопоруко получается))) А тут всё ясно, поймет каждый. Алексей, вы молодец, только профессионал может так доходчиво излагать материал.

0

Сходите в кино на "Финансовый Монстр". Сейчас крутят :)

0

а как быть, если запускаешь новый продукт и данных по продажам еще нет?

0

Берешь бенчмаркинг по запускам сопоставимых продуктов, смотришь на первоначальные объемы по выборке, объективно прикидываешь - в какую категорию попадает твой продукт, затем выделяеш средний growth rate и делаешь свой прогноз. Хотя, это всегда лотерея.

о Игорь, а я слежу за твоими приключениями))

0

"Прикидываешь" - это уже не совсем объективно. Есть методы для классификации или определения категорий - кластеризация или модели регрессий множественного выбора.

0

"Если вдруг ваш бизнес молодой, и данных за год пока нет,  — ничего страшного"

"Шаг 1: достаньте данные"

<3

статья о стандартных функциях exсel? Оо

0

простите нас, бездарей, кому это было интересно...

0

Возможность комментирования статьи доступна только в первые две недели после публикации.

Сейчас обсуждают
Дмитрий Лимонов

потому что ресторан не означает "дорого, бохато", как привыкли в РФ. Это всего лишь пункт общественного питания. Да, есть элитные рестораны, а есть в формате закусочных. Мир не кончается там, где ваши представления о нём не совпадают с реальностью.

«Будьте нашим гостем»: кому McDonald's даёт право бесплатно есть в своих ресторанах
0
Владимир Тихомиров

Похоже, пора на собеседовании в Яндекс спрашивать, в самом конце: вилкой в глаз или в жопу раз? И оценивать креативность процесса поиска правильного ответа... Будем перенимать международный опыт с адаптацией под наши условия, так сказать

Бывший глава Google затруднился ответить на один из традиционных вопросов компании на собеседованиях
0
Александр Васильев

Тогда и накопления пойдут больше и быстрее - мы же одинаковые условия считаем, если при ипотеке зп выросла, то берем что и при вкладе зп растет. Разница безусловно будет, но не на порядок.

«Никому не выгодно, чтобы у вас скапливались деньги»
0
Artem Zinnatullin
Juno

Не собираюсь оправдывать ролик сбера, но если вы про вот это видео с футболистом youtu.be/VGEfNcvntno, то оно ничем не лучше, тк там блин оператор(ы) по полю бегают, сверху съемка ведется и рядом с полем люди явно не на телефон снимают. Всем участникам было понятно, что это какой-то прикол. Была бы скрытая съемка — без вопросов.

Так можно и в сбере снять реального инвалида, но с кучей операторов, камер и режиссером рядом, понятное дело, его будут обслуживать максимально хорошо.

Видео: Герман Греф в «костюме инвалида» в отделении «Сбербанка»
0
Artem Zinnatullin
Juno

Я может не понимаю, но в чем большая разница между "в имитирующем инвалида костюме" и "под видом инвалида"?

Не вижу "небо и земля" на скриншоте. У всех одинаково желтушные заголовки.

Видео: Герман Греф в «костюме инвалида» в отделении «Сбербанка»
0
Показать еще