Amazon объяснила причины массового сбоя Amazon Web Services — это «редкая» программная ошибка и «неисправная» автоматизация
Компания добавит дополнительные проверки системы.
Источник: Getty Images
- Amazon объяснила причину сбоя Amazon Web Services (AWS), который вызвал перебои в работе сервисов по миру 20-21 октября 2025 года. Он затронул банки и платёжные платформы, нейросети, мессенджеры, игры и «умные» устройства.
- По словам компании, система удалила привязки IP-адресов к одной из точек доступа облачной инфраструктуры — из-за двух конфликтующих друг с другом программ, которые отвечают за обновление DNS-записей. Это затронуло по цепной реакции и другие облачные инструменты Amazon. В результате внешние сервисы не могли подключиться к AWS.
- При восстановлении системы инженеры столкнулись с перегрузкой запросов и некоторые процессы им пришлось перезапускать вручную. Они решили основные проблемы к 14:00 мск 21 октября.
- Сетевые инженеры и специалисты по инфраструктуре отметили в интервью Wired, что подобные инциденты неизбежны для компаний вроде Amazon, Microsoft Azure или Google Cloud Platform, учитывая их сложность и масштаб.
- «В основе облачных вычислений лежит бесконечный список сложных сервисов и зависимостей, которые находятся в одном шаге от поломки», — сказал соучредитель стартапа по системной безопасности Neon Cyber Марк Сент-Джон.
- «Amazon не часто сталкивается с такими “каскадными” сбоями. С другой стороны, она сама создаёт такую ситуацию, привлекая всё больше клиентов к своей инфраструктуре», — добавил Джейк Уильямс из компании по управлению киберрисками Hunter Strategy.
27 комментариев