Почему в Google Analytics не построить аналитику с корректными данными, и как решили эту проблему в компании «Вилгуд»

Кейс пишется совместно с компанией R7K12 о том, как устроена аналитика в компании «Вилгуд», и как построить сквозную аналитику для b2b и b2c.

Почему в Google Analytics не построить аналитику с корректными данными, и как решили эту проблему в компании «Вилгуд»
44

"Но есть ограничение — не более 100 000 строк для таблицы." - а переведите это высказывание. Если речь идет о визуальном элементе "таблица", то зачем вам в Power BI (!!!) 100.000 строк? Или речь о другом?

1

то ли тянули напрямую без промежуточной бд, то ли что... я миллионами тяну из bq и нормально

3

Если у вас на сайте 100 000 сеансов, то таблица с сеансами будет содержать 100 000 строк. Если больше - Power BI уже не тянет.

Начало хорошее, а вот дальше ощущение заказухи с целью рекламы R7K12.
Вот например: "С помощью R-скрипта была попытка собрать данные из API Яндекс.Директа по 100 аккаунтам. Она не увенчалась успехом"
Скрипт значит не смог, а R7K12 смог. Как так? API для всех одно. Или вы скрипт вызывали из PowerBI и каждый раз из всех аккаунтов тянули все данные за весь период? Тогда неудивительно что вылетали по лимитам

2

Очередная пропаганда всякой херни за деньги. R и Phyton могут все. BQ тоже не панацея тем более опять за деньги. Что мешает поднять все тоже самое без денег? )

Супер, я бы ещё посоветовал использовать Funnel-Based модель атрибуции для полноты данных. Рекомендую для этого сервис на букву О, но не буду его пиарить.

1

В статье есть неточности касаемо лимитов Google Analytics (https://support.google.com/analytics/answer/6016094?hl=ru) на загрузку данных о расходах.
1. Лимит 90МБ на дату. И он касается именно даты к которой относятся расходы, но никак на количество данных загруженных за день.
2. Не совсем ясно, где вы взяли лимит в 10ГБ на ресурс.

Добрый день!
Касательно лимитов:
На момент принятия решения о необходимости нового сервиса (r7k12) в Google Analytics, в частности в Analytics API, последней доступной версией была v2. В ней как раз были ограничения, описанные в статье:

1. Лимит 100 МБ на дату (из версии v2). Верно, этот лимит касается даты, к которой относятся расходы. И именно в него мы упирались: за один день на одну дату статистики часто не могли загрузить расходы. Поэтому на следующий день приходилось догружать данные за эту дату.

Были перепробованы разные варианты шаманства и плясок с бубном для обхода этих ограничений, но это другая длинная история.

2. Стандартные ограничения (из версии v2):
10 Гб за ресурс
10 ГБ на набор данных

Если бы на данный момент с новой версией API мы выгружали данные в Google Analytics, мы также упирались бы в квоты.
Посмотреть ограничения v2 можно по данной ссылке:
https://developers.google.com/analytics/devguides/config/mgmt/v2/limits-quotas?hl=ru#data_import

1

Попробуем смоделировать такое же, но без включения платных сервисов, а рук умелых программистов.
Поделимся кейсом потом.

1

А как у вас моделями атрибуции? Мы в https://utmstat.com/business-intelligence фиксируем first_click и last_click источник для целей и заявок в CRM, что дает более полную картину эффективности рекламных каналов.

Думал, что сейчас будет интересная статья с подробностями и скринами, но нет.

Согласен и с основным посылом написанного - не стоит использовать Google Analytics для сквозной аналитики (на этот счет есть хорошие доклады Ильи Красинского).
Согласен с Олегом Басмановым, что статья больше похожа на рекламу сервиса.

Вы проделали большую работу по настройке аналитики это точно.

Было бы интересно узнать (думаю, что не мне одному) с какими проблемами вы столкнулись при смене модели сбора данных, как их решали, с чем столкнулись в реальности (неожиданные проблемы и их решения) и т.д. Это интересный опыт со стороны тех, кто прошел его. И было бы жаль, если бы вы им не поделились.

Спасибо