Система хранения данных: что это, виды СХД и как выбрать?
Система хранения данных (СХД) – это устройство для хранения и управления данными. Используется для решения проблем, связанных с большими объёмами информации.
Ранее все данные могли храниться на одном жёстком диске, однако сейчас любая функциональная система требует отдельного. Благодаря СХД можно рассредоточить информацию по разным хранилищам, тем самым децентрализовав её.
Система хранения данных отличается от пользовательского жесткого диска сложной архитектурой, возможностью объединять хранилища в сеть передачи данных, наличием отдельного программного обеспечения для управления системой хранения, продвинутыми технологиями резервного копирования, сжатия и виртуализации.
Классификация СХД:
1. Файловые хранилища
Данные хранятся в виде файлов. Такой вид СХД используется для хранения информации, не требующая операционных вычислений. На файловых хранилищах строятся NAS. Однако есть и недостатки, например, при накоплении больших объемов данных усложняется иерархия папок, что влияет на скорость работы СХД.
2. Блочные хранилища
Данные хранятся независимо друг от друга. Каждому такому блоку присваивается идентификатор, который позволяет системе размещать каждый блок, где ей удобно. Из недостатков можно выделить сложность настройки и обслуживания и высокую стоимость.
3. Объектные хранилища
Данные хранятся в плоской файловой структуре в виде объектов с метаданными, поэтому объектное хранилище похоже по структуре на БД. По скорости уступает блочному хранилищу в задачах, связанных с транзакционными нагрузками.
Что такое SAN, NAS и DAS?
Обычно выделяют два основных типа СХД, которые различаются уровнем хранения, чтения и записи данных. Первый тип работает с данными файлового уровня. То есть он функционирует как сервер с собственной файловой системой. Второй тип представляет доступ к данным на уровне блоков. Он ускоряет обмен данными между хранилищем и сервером.
SAN (Storage Area Network)
Это сеть хранения данных, которая использует выделенную сеть для работы, тем самым позволяя подключать диски к серверам. Так решается вопрос с утилизацией дискового пространства серверами, а также устраняются точки отказа, неизбежно присутствующие в системах хранения данных на основе DAS. Накопители используются в блочном режиме.
Высокая скорость работы, низкая задержка; хранение данных блоками; высокая надёжность обмена и хранения данных; гибкость и масштабируемость; разгрузка подсети от служебного трафика – это всё преимущества SAN. Однако у SAN есть и недостатки такие как сложность проектирования, большие финансовые затраты, отсутствие возможности некоторых систем и приложений работать с протоколом iSCSI.
NAS (Network-Attached Storage)
Это сетевое хранилище, которое представляет дисковые ресурсы в виде файлов с использованием сетевых протоколов. NAS используется для работы с данными файлового типа, к которым нужен коллективный одновременный доступ. Network-Attached Storage работает через общие маршрутизаторы.
Из преимуществ NAS можно выделить доступность и низкую стоимость, простоту подключения и управления и возможность быстро увеличить объём для хранения данных. Но стоит отметить, что хранение данных осуществляется только в виде файлов, а также предоставление доступа к информации по сетевым протоколам происходит медленно.
DAS (Direct Attach Storage)
Это прямое подключение к рабочему хранилищу. Внутри системы находится блок питания, охлаждение и RAID-контроллер, который обеспечивает надёжность и отказоустойчивость хранилища. Управляется при помощи встроенной операционной системы. Из простоты архитектуры DAS можно выделить её основные преимущества: доступная цена и относительная простота внедрения. Также такой конфигурацией легче управлять, так как число элементов системы мало. Однако DAS требует выделенного сервера (и не больше двух).
Как выбрать СХД?
Стоит разобраться в задачах, которые будет СХД решать, и определиться с базовыми параметрами. Мы рекомендуем обратить внимание на типы данных (разные типы данных требуют разной скорости доступа, технологий обработки), объём данных, отказоустойчивость (необходимо представлять, какова стоимость потери данных за определённое время), вендор и производительность.