Как контролировать воронку данных: 3 ключевых рекомендации

Аналитики данных регулярно сталкиваются с дилеммой, которую невозможно решить: либо использовать все данные для анализа и ждать вечность, пока он завершится, либо выбросить часть ненужных данных, рискуя, что их может быть недостаточно для точного анализа.

1616

Вообще, тема достаточно непростая. В программировании надо думать итерациями (выбираем по одному то, что подходит), а в работе с базами данных надо наоборот, думать множествами (сваливаем всё в кучу, а потом выбрасываем то, что не подходит). Если этого не сделать — мозг начинает порождать сонмы сто лет ненужных коррелированных подзапросов, в которых чёрт ногу сломит.

Ответить