Описание того, чем занимается Инженер данных, невозможно без упоминания «Хранилищ данных» (Data Warehouse или DWH) и «Озер данных» (Data Lake). Несмотря на то, что оба термина подразумевают загрузку и хранение неограниченного количества данных (это в теории, на практике, конечно, любое хранилище всегда ограничено по объему), различия между Хранилищем и Озером данных очень существенное. И если DWH предназначено для хранения структурированных данных, то Data Lake организуется таким образом, что позволяет хранить любые данные – как структурированные данные (таблицы баз данных, XML, CSV и др.), так и неструктурированные («сырые») данные – такие как видео- или аудиофайлы. Обработка данных производится с использованием процессов ETL и ELT. Что это такое?