Представим, что мы переезжаем в новую квартиру и привозим с собой кучу вещей. Сортировать их у нас нет времени и сил. Мы все складываем в большую кладовку. Это и будет Data Lake (озеро данных) нашей квартиры. Эти данные — «сырые», необработанные. Часть вещей из кладовки мы можем достать и поместить в шкаф (в IT корпоративное хранилище или DWH) – то есть здесь данные уже будут в едином формате, с четкой структурой, и достать их будет легко и быстро. Сам процесс переноса в «шкаф вещей» в IT происходит с помощью ETL-средств (в переводе извлечение, трансформация, загрузка), этим процессом занимаются data – аналитики. Чтобы все вещи перераспределить по шкафам, нужно много времени и денег, а может часть вещей нам и не потребуется, поэтому иногда хранить в кладовке общей кучей дешевле.