Обработка больших данных средствами PySpark SQL

Наиболее популярными инструментами для сбора и обработки больших данных являются Hadoop MapReduce и Apache Spark. Оба этих инструмента имеют свои плюсы и минусы, однако в данной статье мы будем рассматривать Apache Spark, в частности библиотеку для python PySpark.

77 показов
1.6K1.6K открытий