Как научить инженеров ЦОД работать с инцидентами и быть готовыми ко всем внештатным ситуациям?

Лучший способ отработки внештатных ситуаций с инженерной инфраструктурой дата-центра — превентивный подход к проблеме. Готовых отраслевых методик здесь не существует, поэтому каждый провайдер создает свою систем. В статье делимся нашим опытом на примере ЦОДа в Петербурге.

88

Можно прикинуть перспективы автоматизации мониторинга работы ЦОДа в этом свете? Они сокращают потенциальное влияние человеческого фактора или просто переводят его возможное влияние на работу площадки на новый уровень, т.е. все равно итоговое решение принимает человек, и завалить работу он может точно также, как и раньше?

1

Если вы имеете в виду, требование TIER4 о “способности инфраструктуры самостоятельно реагировать на аварии” то да, наличие автоматизации систем ЦОД переводит площадку на новый уровень, уменьшая влияние человеческого фактора, но не исключает его, поэтому роль аттестации и тренировок по прежнему велика.