Amazon объяснила причины массового сбоя Amazon Web Services — это «редкая» программная ошибка и «неисправная» автоматизация

Компания добавит дополнительные проверки системы.

Amazon объяснила причину сбоя Amazon Web Services (AWS), который вызвал перебои в работе сервисов по миру 20-21 октября 2025 года. Он затронул банки и платёжные платформы, нейросети, мессенджеры, игры и «умные» устройства.
По словам компании, система удалила привязки IP-адресов к одной из точек доступа облачной инфраструктуры — из-за двух конфликтующих друг с другом программ, которые отвечают за обновление DNS-записей. Это затронуло по цепной реакции и другие облачные инструменты Amazon. В результате внешние сервисы не могли подключиться к AWS.
При восстановлении системы инженеры столкнулись с перегрузкой запросов и некоторые процессы им пришлось перезапускать вручную. Они решили основные проблемы к 14:00 мск 21 октября.
Сетевые инженеры и специалисты по инфраструктуре отметили в интервью Wired, что подобные инциденты неизбежны для компаний вроде Amazon, Microsoft Azure или Google Cloud Platform, учитывая их сложность и масштаб.
«В основе облачных вычислений лежит бесконечный список сложных сервисов и зависимостей, которые находятся в одном шаге от поломки», — сказал соучредитель стартапа по системной безопасности Neon Cyber Марк Сент-Джон.
«Amazon не часто сталкивается с такими “каскадными” сбоями. С другой стороны, она сама создаёт такую ситуацию, привлекая всё больше клиентов к своей инфраструктуре», — добавил Джейк Уильямс из компании по управлению киберрисками Hunter Strategy.

«Умные» матрасы застревали в поднятом положении, не получалось оплатить заправку и заказать такси: сбой AWS продлился 13 часов и вызвал дискуссии о «зависимости» сервисов от Amazon

Специалисты напомнили о важности децентрализации серверов на фоне массовых жалоб клиентов.

«Умный» матрас Eight Sleep в вертикальном положении. Источник: Eight Sleep

#новости