Как научить инженеров ЦОД работать с инцидентами и быть готовыми ко всем внештатным ситуациям?

Лучший способ отработки внештатных ситуаций с инженерной инфраструктурой дата-центра — превентивный подход к проблеме. Готовых отраслевых методик здесь не существует, поэтому каждый провайдер создает свою систем. В статье делимся нашим опытом на примере ЦОДа в Петербурге.

88

В теории - насколько реально предусмотреть и задокументировать вообще все реальные сценарии форс-мажора? Как такие программы влияют на структуру и численность штата персонала в дата-центре - например, мы все оптимизировали, обтренировали, и людей стало нужно в 1,5 раза меньше и т.д.?

1

Предусмотреть все аварийные ситуации на самом деле сложно, качество проработки зависит от опыта команды эксплуатации и реализации процесса непрерывного улучшения документации по итогам полученного опыта. На структуру и численность персонала это никак не влияет.