При работе с BigData стоит учитывать, что какая-то часть выявляемых закономерностей являются ошибочными. Чтобы лучше находить эти недостоверные зависимости, лучше всего отталкиваться от того, какими они бывают.
Кому лениво искать книгу, посмотрите сайт «Подозрительные корреляции» Тайлера Вигена:
А вообще хорошо, что автор напомнил о золотом правиле статистики - корреляции сами по себе не подразумевают причинно-следственной связи👍🏻