«Резервный ЦОД» в облаке – универсальное решение широкого круга задач ИТ-менеджера

Большинство ИТ-специалистов относятся к резервному копированию достаточно консервативно. Между тем, компании активно используют новые технологии ИТ-трансформации и облачные сервисы, не задумываясь, что фактически с помощью облака могут решить сразу несколько задач, в том числе отказоустойчивости, резервирования, безопасности, модернизации и миграции.

С октября по декабрь 2021 года независимая исследовательская компания провела опрос более 3000 ИТ-руководителей и ИТ-специалистов, посвященный факторам и стратегиям развития защиты ИТ-инфраструктуры и данных в 2022 году. Почти все респонденты работают в организациях, насчитывающих более 1000 сотрудников. Они представляют 28 различных стран, в том числе 327 респондентов — страны Восточной Европы и Россию. Исследование тенденций в сфере защиты данных проводилось уже третий год подряд. В этот раз целью опроса было определить количественные показатели изменений с точки зрения проблем с защитой данных и целей в этой сфере.

В результате исследования выяснилось следующее:

· 67% организаций используют облачные сервисы в рамках стратегии защиты данных;

· 76% организаций за последний год подверглись по крайней мере одной атаке программ вымогателей;

· 40% серверов как минимум один раз оказывались в ситуации вынужденного простоя;

· 53% организаций столкнулись со сбоями в работе из-за атак программ-вымогателей. Уже второй год подряд кибератаки становятся причиной большинства простоев;

· 36% данных оказалось невозможно восстановить после атаки программ-вымогателей;

· 42% ИТ-руководителей в мире считают, что главная характеристика любого решения для резервного копирования данных в крупных компаниях ― широта спектра защищаемых систем;

· 19% организаций поменяли решения для резервного копирования в первую очередь по экономическим причинам, а 27% стремились повысить надежность и сократить показатели RPO/RTO.

Опрос выявил печальную статистику – после кибератак компании не могут восстановить 33% данных. При этом перед любой организацией стоят задачи сохранности данных, обеспечения отказоустойчивости с необходимым минимальным временем простоя и защиты от угроз, например, вымогателей-шифровальщиков.

Так, по данным исследования компании Forester, выделяют следующие основные причины сбоев и простоя бизнеса:

· 37% - сбои в инфраструктуре;

· 24% - кибер-атаки;

· 18% - сбои электропитания;

· 13% - человеческий фактор.

С учетом текущей ситуации, гибридного формата работы сотрудников и сложности атак на системы безопасности, ИТ-службы находятся в постоянно сжимающихся тисках ограниченности ресурсов: времени, бюджета, кадровых, а также требований к неизменности бизнес-процессов. Поэтому непрерывность работы компании и защита данных стали важнейшими приоритетами. Проблемы растут, медлить нельзя.

Современным компаниям для успешного развития и обслуживания ИТ-инфраструктур важно уметь интегрировать и совмещать ИT-ресурсы в офисе и облаке, качественно распределять ИТ-сервисы по нескольким облачным платформам с сохранением их логической целостности. Выбирая нужное решение, организации сталкиваются с необходимостью предварительно продумать многочисленные сценарии, которые, с одной стороны, обеспечат требования безопасности и отказоустойчивости, с другой, позволят развивать ИТ-сервисы с необходимой скоростью. Как всегда, на чаше весов несколько противоречивых требований, поэтому задача ИТ-менеджера провести тщательный анализ и найти необходимый баланс при выборе решений.

Работа осложняется тем, что информационные технологии стремительно развиваются и должны обеспечивать с опережением необходимый уровень ускорения развития кампаний и цифровой трансформации. И, казалось бы, только вчера купленное совсем недешевое, но такое «железное» решение с дорогими сердцу и кошельку ленточными или многодисковыми устройствами, уже утром не обеспечивает новые сценарии резервирования и модернизации. С одной стороны, экспоненциально увеличиваются обрабатываемые и резервируемые объемы информации, быстро растут и размножаются базы данных, разработчики требуют космической скорости развития сервисов, с другой, - бизнес требует 100% сохранности и нулевого времени простоя, но с возможностью быстрой миграции нагрузок и данных между платформами и провайдерами.

Для оценки необходимого уровня резервирования и отказоустойчивости ИТ-сервисов используются три основных параметра, которые определяются требованиями и сильно влияют на стоимость любого решения:

· RTO (Recovery time objective) – время восстановления (допустимое время простоя/восстановления ИТ-системы);

· RPO (Recovery point objective) – точка возврата (допустимый объем потери данных ИТ-системы);

· RCO (Recovery capacity objective) – какую часть нагрузки должна обеспечивать резервная система; может измеряться в процентах, транзакциях ИТ-систем и других величинах.

Иными словами, по шкале времени, RPO – время создания последней резервной копии, на момент которой можно вернуться в случае сбоя. RTO – время, которое необходимо потратить на восстановление. Например, извлечь данные из резервной копии и вернуть ИТ-систему в рабочее состояние.

Для выбора оптимального решения резервного копирования необходимо предварительно оценить и соотнести стоимость времени простоя (RTO) и решения (стоимость потери данных в точке RPO):

Существует три распространенных варианта резервирования ИТ-систем, которые самостоятельно или в комбинации решают более 90% задач обеспечения отказоустойчивости, резервирования, безопасности, модернизации и миграции:

1. «Холодный резерв» - решение для репликации и резервного копирования любых данных на удалённое хранилище, включая облачное.

2. «Теплый резерв» - полнофункциональная резервная или вспомогательная площадка на случай прекращения работоспособности основной площадки или временного расширения нагрузки.

3. «Горячий резерв» - решение с максимальным уровнем отказоустойчивости информационных систем или отдельных решений.

Далее подробнее про каждый вариант.

«Холодный резерв» может быть обычным резервным копированием с необходимой глубиной хранения.

Офисная инфраструктура через site-to-site VPN подключается к облачной. Настраиваются правила резервного копирования (перечень ресурсов, периодичность, глубина и т.п.). В случае потери данных в офисе они будут гарантированно восстановлены из географически удалённого ЦОДа, в том числе, в случае катастрофы.

Холодный резерв

«Теплый резерв» может быть организован на основе быстрого резервного копирования с минимально возможным временем потери и восстановления информации и состояния системы. Это может быть горячий резерв только части сервисов, например, базы данных или иных систем в режиме репликации без активного использования вычислительных мощностей: процессоров и памяти.

Важно решить, какую часть нагрузки должна обеспечивать резервная система, и, если необходимо, возможное время развертывания резервной площадки на полную или частичную мощность.

Теплый резерв

«Горячий резерв» может совмещать максимальную отказоустойчивость, геораспределенность и балансировку нагрузки как на уровне приложений, так и на платформенном уровне: уровне операционных систем и систем хранения.

Примеры решения «Горячий резерв / геораспределенный кластер»

Выбирая золотую середину, мы фактически расставляем приоритеты: допустимое время простоя, риски, бюджет и, что сейчас наиболее важно, необходимую гибкость решения. Баланс должен обеспечить развитие ИТ-сервисов за минимально возможное время и вероятную смену приоритетов, так как, например, самый сложный и дорогой сценарий горячего резервирования, благодаря стремительному развитию облачных технологий, сейчас становится невероятно доступнее и дешевле.

На рынке имеется большое количество узкоспециализированных и универсальных решений. С целью экономии и упрощения можно выбрать один продукт или решать задачи дискретно для обеспечения более глубокого уровня внедрения. При выборе провайдера важно избежать лишних затрат и сложностей, связанных с созданием и сопровождением собственной резервной площадки, но при этом обеспечить минимальную потерю данных и быстрое восстановление в случае сбоя основной площадки.

Стоит фокусироваться на следующих основных требованиях и приоритетах:

· быстрое развертывание – решение не должно быть слишком сложным; подключение и настройка сервиса осуществляются в кратчайшие сроки специалистами провайдера;

· сокращение затрат на инфраструктуру – решение должно сокращать расходы на развертывание, мониторинг и поддержку резервной площадки с оплатой только стоимости сервиса и ресурсов по фактическому потреблению;

· минимально возможное время простоя и потери данных – решение должно обеспечивать минимально допустимое время простоя и потери данных благодаря надёжному восстановлению и частоте реплик.

Выводы

Новое решение для резервирования должно работать по принципу «настроил и забыл», чтобы быть спокойным и полностью уверенным в том, что данные в нужный момент будут восстановлены. Также продукт должен обладать простой и гибкой ценовой моделью, совместимостью со всем используемым оборудованием и хранилищами, различными вариантами восстановления для соответствия требованиям любых SLA. Безусловно, иметь подтвержденные успешные примеры использования заказчиками. Но при этом новое решение для резервного копирования не должно занимать много времени на его изучение и внедрение, оно должно помочь ИТ-специалистам сэкономить время для работы над более приоритетными задачами.

Резервный /вспомогательный ЦОД должен обеспечивать

· аварийное восстановление и репликацию данных;

· защиту от рисков и связанных с ними убытков;

· возможность оперативно восстановить данные;

· размещение в отказоустойчивых ЦОД Tier III;

· тарификацию только за реально использованные ресурсы.

В зависимости от требований и бюджета может быть организована репликация всей ИТ-инфраструктуры («горячий резерв») или ограниченная/минимальная по виртуальным мощностям, например, в режиме вспомогательного и резервного DC / ЦОД («теплый резерв» или «холодный резерв»). В облаке размещается резервная или вспомогательная ИТ-инфраструктура, а основная – на площадке заказчика или в другом облаке.

Решение Резервный /вспомогательный ЦОД безопаснее размещать в облаке надежного провайдера, где он успешно используется в следующих вариантах работы:

· «Холодный», «теплый» и «горячий» резерв, Резервный ЦОД с запуском по требованию – в случае отказа основной площадки, приложения и сервисы автоматически запускаются на другой (обеспечение непрерывности бизнеса).

· Решение вспомогательных задач: тестовые площадки под новые проекты, среды для разработки, кросс-миграция между ИТ-площадками для целей модернизации и оптимизации ПО и аппаратного обеспечения, масштабирование вычислительных ресурсов при пиковой нагрузке, эластичная ИТ, быстрое развертывание дополнительных сервисов и рабочих мест.

Резервный ЦОД с гибридной и комбинированной инфраструктурой – оптимальное решение для крупных ИТ-инфраструктур, часто используется в комбинации с услугами по модели аренды и размещения оборудования: Dedicated и Colocation.

Успешной практикой поэтапной миграции ИТ-инфраструктуры в облако является первоначальное создание резервной инфраструктуры в облаке, так называемого резервного ЦОД, и дальнейшая поэтапная миграция информационных систем. Этим обеспечивается решение 3-х важнейших задач:

1. Обеспечение необходимого уровня резервного копирования, отказоустойчивости и безопасности.

2. Снижение стоимости эксплуатации при непрерывном развитии информационных систем в эластичной ИТ-инфраструктуре облака.

Максимальная пластичность в выборе доступных решений, обусловленная требованиями современной реальности

0
Комментарии
-3 комментариев
Раскрывать всегда