Инструкция: A/B-тестирование иконки приложения в Google Play

Как благодаря правильно подобранному дизайну иконки увеличить конверсию скачиваний — рекомендации от команды сервиса «Фотострана».

Инструкция: A/B-тестирование иконки приложения в Google Play

Мы в «Фотостране» решили проверить, можно ли улучшить текущие показатели, и провели А/B-тестирование. Эксперимент проводили с помощью Store Listing Experiments, который встроен в Google Play Developer Console. В этом материале мы расскажем, на что следует обратить внимание при проведении А/B-теста в Google Play и каких результатов можно достичь.

Инструкция: A/B-тестирование иконки приложения в Google Play

Есть несколько моментов, которые надо учитывать при тестировании иконок в Google Play:

  • Вы можете тестировать иконку только уже опубликованного приложения.
  • Нельзя одновременно тестировать иконку и, например, описание — это самая распространенная ошибка, и Google страхует от нее. Ваш эксперимент должен проверять только одну гипотезу.
  • Google Play предоставляет весьма скромные данные для анализа. Тем не менее вы узнаете, какой вариант в среднем конвертируется лучше, сколько было инсталлов и удалений и сколько в итоге получилось пользователей приложения в каждой тестовой группе.
  • Вы не можете проводить A/B-тесты на определенной аудитории: сегментация ограничивается только геолокацией и страной, в которой вы хотите локализовать иконку или другие элементы.

Аудитория

Тестовую версию иконки вы можете показать не более чем 50% вашей аудитории. Мы проводили эксперимент с аудиторией 50/50, а в нескольких случаях — многовариантное тестирование со следующим распределением: 50% — на текущую иконку, и по 25% — на тестовые варианты.

Срок тестирования и размер выборки

Срок тестирования зависит от количества трафика: чем его меньше, тем дольше будет длиться эксперимент. Каждый вариант мы тестировали семь дней на органическом трафике, так как в разные дни поведение пользователей отличается и значения конверсии «прыгают».

Для получения более достоверных данных эксперимент должен длиться две-три недели, чтобы у вас было четкое понимание того, как день недели влияет на установки. Например, мы четко видим проседание трафика в выходные и праздничные дни. Но этот срок может быть как больше, так и меньше — в зависимости от количества установок.

Если у вас нет органического трафика (или его слишком мало) и вы решили его закупить для А/В-теста, то воспользуйтесь специальным калькулятором, чтобы определить минимальный размер выборки. Однако имейте в виду, что в зависимости от типа платного трафика лучшие результаты могут быть разными. Если в дальнейшем вы планируете закупать такой же трафик, как и на тестах, то смело проводите эксперимент.

В нашем случае рекомендации были следующие:

Рекомендации калькулятора Optimizely по размеру выборки
Рекомендации калькулятора Optimizely по размеру выборки

Обратите внимание, что минимальный эффект указан не в абсолютных, а в относительных величинах. Другими словами, изменение конверсии с 40% на 5% означает получение данных в диапазоне от 38% до 42% (40% +/- (5% * 40%). 7800 — столько раз показывался каждый вариант иконки. Если вы проводите А/В-тест с распределением 50/50, то общая выборка составит 15600.

Во время тестов не меняйте стратегию и источники закупок: конверсия в большей степени зависит от качества трафика.

Интерпретация результатов

На первом этапе мы тестировали следующие варианты:

Инструкция: A/B-тестирование иконки приложения в Google Play

Так как Google показывает вашу текущую иконку как минимум половине аудитории, а процент показов тестового варианта может быть в разы меньше, то для сравнения результатов он вычисляет взвешенное число установок.

Инструкция: A/B-тестирование иконки приложения в Google Play

Результат определяется на основе доверительного интервала — 90%. Следовательно, в 90% случаев показатели конверсии будут в диапазоне от +0,4% до +11,6% по сравнению с текущим вариантом. Для сопоставления результатов вычислите среднюю эффективность (в данном случае это 6%).

По мнению Google Play, можно утверждать, что вариант B эффективнее варианта А, только если разница между ними составляет не менее 5%. В противном случае результаты эксперимента считаются недостоверными.

Продолжаем тестировать

По итогам эксперимента иконку В мы установили в качестве основной и продолжили экспериментировать.

Инструкция: A/B-тестирование иконки приложения в Google Play

Синяя иконка показала лучший результат и потому была поставлена основной. Дальнейшие четыре теста дали отрицательный итог.

Инструкция: A/B-тестирование иконки приложения в Google Play

Неожиданно хороший результат показал пятый тест с иконкой на зеленом фоне.

Инструкция: A/B-тестирование иконки приложения в Google Play

Однако мы решили отказаться от нее, так как она не соответствует основным цветам приложения. Поэтому сделали такую же иконку в синих тонах.

Инструкция: A/B-тестирование иконки приложения в Google Play
Инструкция: A/B-тестирование иконки приложения в Google Play

К сожалению, этот вариант не сработал: иконка была в среднем на 4,95% менее эффективна, и мы продолжили тесты. Взяли текущую иконку и добавили к ней значки «2017» и «Free».

Инструкция: A/B-тестирование иконки приложения в Google Play

На скриншоте ниже видно, что при небольшой выборке у нас огромный разброс вариантов: 24,2 для иконки с надписью «2017», и 26,2 для иконки с надписью «FREE». Важно не принимать поспешных выводов, а продолжать тестирование. Чем больше целевых действий сделано, тем меньше будет разброс.

Инструкция: A/B-тестирование иконки приложения в Google Play

Google поможет определиться и подскажет, когда данные теста можно считать достоверными. Мы остановились на следующих показателях:

Инструкция: A/B-тестирование иконки приложения в Google Play

По итогам эксперимента была выбрана иконка с надписью «Free», которая оказалась эффективнее на 12,3% по сравнению с предыдущим вариантом.

Инструкция: A/B-тестирование иконки приложения в Google Play

К сожалению, Store Listing Experiments не дают нам всех данных для более глубокого статистического анализа — при принятии решения мы можем ориентироваться только на среднюю эффективность. Тем не менее это отличный инструмент для тестирования различных элементов, который может значительно увеличить конверсию установок.

1414
5 комментариев

Было бы еще интересно напрямую сравнить самый первый вариант и самый последний, какая между ними была бы разница.

3

Хорошая идея :)
Я, честно, думаю, что результат может нас удивить :) судя по всему для нашего проекта регулярная смена иконки на любую другую может сама по себе давать некоторый краткосрочный рост конверсии.

Иконка с купальником - огонь =)

Я вначале подумал, какая связь между ФС и этой злобной рожей? =)

Относитесь к этому инструменту скептически. Протестируйте теперь иконку саму с собой (АА тест). Скорее всего она сама у себя выиграет, возможно даже с большим отрывом.