Допустим, мы хотим, чтобы нашей сетью занимались инженеры, способные докопаться до истины, и разобраться с оборудованием и софтом. Задача кажется банальной, но не всё так просто. Как понять, что человек может разобраться? Результаты в IT не наступают моментально - их видно минимум через год, а иногда и через два-три - аварийность, экономия денег на ресурсах, скорость релизов и прочие метрики. Кроме того - часто "голые метрики" по системе, которую коллектив вытачивал год - не говорят о том, что люди действительно могут разобраться в проблемах - даешь им другую новую систему и ничего не получается. Да, просто повезло. Да, просто не отхватили полный спектр проблем на предыдущем проекте. И еще куча мелких причин почему там получилось, а здесь нет. Главная первопричина едина - имеющийся коллектив не имеет инженерного подхода к работе и действует "решая проблемы по мере поступления", вместо создания расчётной конструкции с понятными и проверенными характеристиками. В IT-инфраструктуре такое практически в каждом отделе эксплуатации/DevOps/SRE/как-не-назови.