Обработку данных большого объёма можно удобно и быстро производить на кластере с помощью Spark. Но что делать, если встроенных функций не хватает? Написать свою!