Лучший способ отработки внештатных ситуаций с инженерной инфраструктурой дата-центра — превентивный подход к проблеме. Готовых отраслевых методик здесь не существует, поэтому каждый провайдер создает свою систем. В статье делимся нашим опытом на примере ЦОДа в Петербурге.
Корреляция с требованиями Uptime в этой программе вашей есть, или вы просто сами идете по своему пути полностью? В смысле - делитесь ли best practices с международным сообществом или там уже и так все это знают, умеют и применяют?
У требований Uptime есть один критерий - наличие процесса. Как этот процесс должен выглядеть и каким образом реализуется - это на усмотрение каждой организации. Но, например, некоторые наши примеры наработок в этой области используются в курсах Uptime по этой теме.