Это работает, когда единственная обязанность сотрудника — дежурство и саппорт. Если у вас нет трёх-пяти человек, денно и нощно сменяющих друг друга, или люди заняты не только дежурством, но и разработкой, у меня плохие новости. В крайнем случае между даунтаймом и моментом, когда инженер возьмётся за работу, пройдут часы, а иногда — дни.
Нужно БОЛЬШЕ ССЫЛОК в тексте.
это ж не попса. любая серьёзная работа просто изобилует ссылками на источники информации, прошлый опыт и более развёрнутые исследования
Вы считаете, что много ссылок — это плохо? Почему?
Фото с MSK-IX на Бакулева? Судя по расположению домов - да.
Не "программисты", не "бекендеры". Даже не "очень хорошие". Надежность, отказоустойчивость и танго с облачными провайдерами — это вотчина отдельных людей: DevOps и, если вам повезло, Site Reliability Engineer'ов (SRE).Вина в падениях часто программеров.
Самое неэффективное, что может сделать руководитель после падения — это пойти и отчитать программиста, который катнул багу на прод.
Бодрые команды практикуют blameless postmortems. Это митинг, на котором задача не найти виноватого, кто получит люлей за криворукость, а создать action plan, чтобы этого не повторилось. Внести системное изменение в процесс. Классические решения: повысить покрытие тестами, канареечный деплой, разбить продукт на beta/prod...
Neo Geo на Калужской)
А я бы не был против повторить судьбу fb и Cloudflare (
Что со мной не так...