Хранение событий в таких количествах требует предварительной их подготовки, например - дедупликации, очистки, выделения данных из словарей, трансформации и разделения по таблицам и т.п. Для этих операций существуют специальные системы, которые осуществляют ETL-процессинг (ETL - Extract, Transform, Load - ровно то, что они делают с данными). Примеры ETL-систем: Apache NiFi, Streamsets.
Спасибо, интересная статья