{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Объясняю масштабный сбой Facebook на картинках

Вечером 4 октября весь Интернет наблюдал за глобальным падением Facebook, Instagram и WhatsApp, которое продлилось больше 6 часов. А затем неполадки появились в Telegram, Twitter, Youtube и многих других сервисах. Даже упали сервера Oculus — люди, находящиеся в момент падения серверов в шлемах виртуальной реальности, увидели, что всё вокруг стало чёрное, и подумали, что умерли. По крайней мере, так шутят на Reddit.

На самом деле, владельцы Oculus могли с переменным успехом пользоваться скаченными приложениями, но всё равно забавно. Efeed 

Мне надоели скучные, длинные и сложные лонгриды про объяснение интернет-апокалипсиса и я решил написать свою статью в стиле легендарного Wait But Why. Таких я ещё не видел. Прочитал десятки статей, источников, отчётов и мнений, из-за чего публикую материал только сегодня. Вышло очень просто о сложном и с понятными иллюстрациями.

Для начала: как работает Интернет

Интернет — это огромный улей. Он поделён на очень много пчелиных сот, где каждая сота — своя сеть. Все они пронумерованы для удобства. Например, сота №1 это ваша сеть, в которой только вы смотрите Youtube и залипаете в TikTok. А сота №2 это сеть вашего друга. Между вашими сетями передаётся информация, к примеру, сообщения в Telegram. Получается коммуникация, а такой обмен называют протоколом BGP.

Маршрутизаторы — устройства с антеннами, разбросанные по всему миру и передающие информацию между всеми сетями. Они выстраивают маршрут из сети в сеть. Выключишь один: и как домино все остальные перестанут нести информацию, поток остановится.

Что произошло

Тут есть несколько вариантов. Либо Facebook выпустило большое обновление ключевых маршрутизаторов, но с ошибкой. Либо сотрудники отключили часть пути сетей для обслуживания — например, для ремонта оптоволоконной линии. Во время обычной работы кто-то дал неправильную команду, которая отключила все сервера Facebook от сети. Из-за случайной ошибки, всё пошло не по плану.

Специальная программа должна была проверять все подобные опасные команды, но почему-то не сделала это.

Одна сеть сказала всем остальным, что у неё больше нет части информации о Facebook. Именно в этой сети жили сервера, которые отвечают за домены, принадлежащие компании. Когда пользователи заходили в Facebook, Instagram и WhatsApp — сети просто ничего не отвечали. Они будто забыли, кто этот ваш Facebook. Случайным образом из системы удалилась эта информация и вместе с ней заглохли все остальные маршрутизаторы.

Фактически все центры обработки данных Facebook во всём мире перестали передавать друг другу информацию и отключились.

Жуткая ситуация, когда сам себе отключаешь доступ к удалённому серверу. Каждый сисадмин хоть раз в ней был. Представляю, какой ад там сейчас творится.

Самат Галимов, Технический директор

Из-за этого во время сбоя домен Facebook.com выставили на продажу на Whois. Формально Facebook перестал существовать в Интернете, и его домен оказался как бы свободным. Но технически его не получилось бы продать, потому что он всё же занят компанией.

Если коротко: капитально лоханулись. Технический запрос «всё ли норм» положил всю сеть, а кто-то заработал ачивку «положил половину интернета одной командой».
Интересно было бы посмотреть на лицо человека, когда он осознал, что произошло. Заодно пульс и давление стоило бы записать, явно в книгу рекордов Гиннеса попал бы.

Алексей Ткачук, Telegram-канал DNative

Что предприняли сотрудники и почему так долго

В Кремниевой долине только началось утро понедельника и сотрудники просыпались. Но вместе с сервисами Facebook, которыми пользуемся мы, перестали работать все корпоративные инструменты. Мессенджеры, адресные книги и даже бейджики — из-за этого в часть офисов нельзя было зайти.

Решить проблему крайне сложно. Сотрудники дата-центров не имеют ключей доступа, а те, у кого есть ключи — находятся далеко от дата-центров. В связи с удалённой работой, некоторые важные кадры могли вообще работать на Мальдивах вдали от серверов.

Сотрудникам пришлось ехать к компьютерам, которые занимаются маршрутизацией сети, из-за чего это заняло так много времени. Но это ещё не все беды: серверные очень сильно охраняются, посторонним инженерам было сложно к ним попасть. А когда не работают даже бейджики и остальные корпоративные инструменты для связи с начальством — ещё сложнее.

К тому же, оборудование и маршрутизаторы специально спроектированы так, чтобы их было сложно модифицировать, даже если у вас есть физический доступ к ним. Опытные инженеры, конечно, смогли обойти все описанные проблемы, но это заняло целых 6 часов.

Даже когда всё починили, слишком много пользователей нахлынуло обратно в сервисы Facebook. Некоторые центры обработки данных не выдержали и на время отключились из-за резкого изменения в энергопотреблении. Представьте, какой для них стресс: то заснули на весь мир, а потом получили в несколько раз больше работы.

Почему досталось всему Интернету

Когда пользователи узнали, что не работают привычные Instagram и WhatsApp, пошли пользоваться другими приложениями. Например, искали спасение в Twitter и Telegram. Сервисы получили неожиданно много нового трафика, из-за чего их сервера не выдержали под нагрузкой. А вот Telegram, кстати, почти устоял и принял 70 миллионов новых пользователей. Трафик некоторых мобильных приложений вырос в 30-50 раз. Очень впечатляет, как мы зависимы от Facebook и к чему может привести такое падение.

Но у кого-то были и другие поводы. Например, сайт Ozon не грузился, потому что для загрузки требовалось подключиться к Facebook. Тысячи людей по всему миру не могли войти в игры, в которые они заходили через соцсеть. Как мы знаем, она просто на время исчезла из Интернета.

Сотрудники всех этих сервисов тоже принялись всё чинить и просто ждать, пока наплыв трафика стихнет.

Только не говори, что такое будет повторяться

К сожалению, подобные сбои ещё будут повторяться много раз. Современный интернет работает по принципам, которые были придуманы больше 30 лет назад. В то время никто не думал, что Интернетом будут пользоваться миллиарды человек.

За прошедшие десятилетия человечество построило Интернет централизованным, уязвимым, и поэтому не устойчивым. Последние крупные сбои Amazon, Google и CloudFare подтвердили, насколько хрупкий Интернет. Это срочно пора исправить.

Что может сделать Facebook и другие компании, чтобы такое больше не повторялось

Сегодня есть очень много систем, которые защищают сервера от случайных действий работников. Если вы меняете важные данные, через 15 минут вам нужно руками подтвердить изменение. Если вы этого не делаете, изменения сбрасываются. Этими системами пользуются много больших корпораций, но Facebook она не помогла.

Теперь её точно будут тестировать на порядок выше, чтобы такое больше не повторилось. В компании уже придумывают, как избежать таких проблем в будущем. Но говоря о такой сложной системе, как Интернет, рано или поздно мы увидим ещё штормы.

Мог ли кто-то внутри Facebook устроить саботаж

Всё возможно, но здесь точного ответа нет.

Компанию давно обвиняют в негативном влиянии на детей, не удалении жестокого контента и тысяч фейковых новостей в соцсети. В тот же день бывшая сотрудница компании Фрэнсин Хауген обвинила Facebook в пренебрежении безопасностью людей ради выгоды, подкрепив свои слова корпоративными документами. На фоне этих скандалов и крупного шторма в соцсети, некоторые подумали, не саботаж ли это?

Официально сбой не вызван действиями злоумышленников. И особых доказательств иному нет.

Заключение

Компаниям остаётся совершенствовать свои системы и в целом Интернет, а нам — спокойно наблюдать. Если у вас есть свой бизнес, подумайте, как вы можете пережить следующий кризис и не потерять клиентов во время сбоя.

Спасибо, что прочитали статью! Подписывайтесь на мой Telegram-канал, там больше похожего контента и анонсы следующих статей. Пишу про стартапы, технологии и науку.

0
13 комментариев
Написать комментарий...
Андрей

Пришёл посмотреть картинки, получил простыню текста.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Миша Магадан

С самого начала какая-то чушь:
"Интернет — это огромный улей. Он поделён на очень много пчелиных сот, где каждая сота — своя сеть. Все они пронумерованы для удобства."

Ответить
Развернуть ветку
Not Boring Tech
Автор

Почему? 

Ответить
Развернуть ветку
Миша Магадан

У большинства пользователей нет сети, у них один комп. Комп подключается к компу провайдера, комп провайдера может общаться с другими компами. Все коппы пронумерованы и могут посылать друг другу данные. 
вот так и то понятнее, как всё работает :)

Ответить
Развернуть ветку
Михаил Белов

То, что у большинства пользователей один комп не значит, что у них за роутером нет сети. Что по вашему находится с другой стороны маршрутизатора?
Про подключение к компу провайдера смешно было. Даже если назвать это оборудование просто компом, то он по вашему не в сети видимо. 
Вы совершенно не понимаете, как работает интернет. В статье, хоть и очень поверхностно, но концепция описана верно. Интернет это сеть сетей. 

Ответить
Развернуть ветку
Миша Магадан
Что по вашему находится с другой стороны маршрутизатора?

ну я так мыслю, что там стоит другой марштрутизатор (считай, компьютер)

Ответить
Развернуть ветку
Михаил Белов

Это верно. Но он ведь маршрутизатором то называется, потому что маршрутизирует трафик между двумя или более сетями.
И если очень грубо говоря то так по цепочке от tier 3 до tier 1 операторов, до тех которые владеют кабелями проложенными через океан.
Но по сути это все сети, от маленьких домашних, до гигантских, которые объединяют целые страны.
https://ru.m.wikipedia.org/wiki/Tier-1-%D0%BE%D0%BF%D0%B5%D1%80%D0%B0%D1%82%D0%BE%D1%80%D1%8B

Ответить
Развернуть ветку
Anatoly Grigoryev

Он даже называется - InterNet, т.е. МежСеть, т.е. Сеть Сетей

Ответить
Развернуть ветку
Marshmy Low

Я считаю, что аналогия вполне верна. 
Недавно почитал статью на habre, перевод. Там примерно тоже самое имели ввиду.

"Интернет — это буквально сеть из сетей, связанных между собой с помощью BGP. BGP позволяет одной сети (скажем, Facebook) объявлять о своём присутствии другим сетям, которые в конечном счёте формируют весь интернет."

Я не спорю, ты тоже прав в плане того, что компы пронумерованы и могут посылать данные, но то, что написано выше - точно не чушь)

Ответить
Развернуть ветку
Миша Магадан

Ну может быть :)

Ответить
Развернуть ветку
Борис Васильев
Официально сбой не вызван действиями злоумышленников. И особых доказательств иному нет.

Позитивные утверждения более доходчивы.

Предлагаю редактуру:
Нет доказательств того, что сбой вызван действиями злоумышленников.
Так что официально, у сбоя другие причины.

Ответить
Развернуть ветку
Денис Носов

Сами сказали что длинные и скучные, хоть у вас и не лучше,такие же длинные и не самые интересные

Ответить
Развернуть ветку
10 комментариев
Раскрывать всегда