Объяснение: что случилось с Facebook, почему долго чинили и может ли это повториться Статьи редакции
Разбор от бывшего директора по распространению технологий «Яндекса» Григория Бакунова.
Пролистал большую статью от Cloudflare про сегодняшнее падение Facebook и решил написать свою — сильно более простую. 4 октября приблизительно в 19:45 мск оглушительно рухнул Facebook и почти все его внешние и внутренние сервисы. Лежал Facebook, Messenger, Instagram, WhatsApp, лежали корпоративные и бизнес-сервисы Facebook, не отвечали ни сайты, ни мобильные приложения.
Что произошло
Судя по всему, кто-то из сетевых администраторов внёс изменения в конфигурацию сети Facebook — причём так, что большая часть этой сети перестала существовать.
Так вот, одна из таких подсетей анонсировала всем внутри и снаружи, что часть сети Facebook теперь находится не у неё. Так получилось, что именно в этой подсети жили NS-сервера, отвечающие за домены, принадлежащие компании. А значит, начиная с какого-то момента все, кто пытался узнать на каком IP-адресе находится facebook.com, стали получать пустой ответ. Последствия предсказуемы: не работает Facebook и все его сервисы у пользователей, внешних и внутренних.
Почему так долго не работали сервисы
Вместе с тем сотрудники Facebook оказались в незавидном положении:
- Недоступные все внутренние ресурсы компании, включая мессенджеры и корпоративные адресные книги.
- Нельзя зайти в офис (часть офисов пускали только по бейджикам, которые привязаны к интернет-авторизации).
- Потеряны почти любые привычные способы коммуникации.
Вдобавок ко всему, большую часть проблем можно было решить только при физическом доступе к серверам, который существенно осложнён привычной расслабленностью удалённой работы. Первые признаки восстановления систем можно было заметить уже после 12 ночи, то есть через три часа глухого молчания.
При этом крепко досталось всему интернету. Лежали почти все крупные соцсети, которым внезапно достался трафик Facebook — люди, не найдя привычных Instagram и WhatsApp, пошли искать спасения в Twitter и Telegram. Получившие новый трафик поначалу радовались, но потом начали стонать под полученной неожиданно нагрузкой.
Сильно пострадали все публичные DNS-сервера — мобильные клиенты Facebook и все сайты, где была авторизация через Facebook или кнопка like, безостановочно DDoS-или свои DNS запросами к несуществующему Facebook. Трафик некоторых мобильных приложений вырос в 30-50 раз. Впечатляет?
Будет ли такое повторяться
Будет. Потому что современный интернет всё ещё базируется на принципах, которые были выработаны 30, а иногда и больше лет назад. Никто тогда не думал о глобальной мировой сети.
За прошедшие годы человечество построило интернет таким, какой он есть сейчас — централизованным, уязвимым и потому неустойчивым. Последние выключения Cloudflare, Amazon, Facebook и других крупных интернетообразующих сервисов показали, насколько хрупкая конструкция этот наш интернет. И кажется это то, что срочно пора исправить.
... За прошедшие годы человечество построило интернет таким, какой он есть сейчас — централизованным
Какие-то взаимоисключающие параграфы. Принципы 30-летней давности наоборот подразумевали децентрализованность, а не то что сейчас.
Все грамотно написано. Откройте книжку протокол TCP IP. Из нее так и веет духом 80-х. А это основной протокол передачи данных в Интернет. Сейчас бы ни кому в голову не пришло такое написать, как и сделать такую DNS, такие OSPF и BGP. Когда все это создавалось, никто и не мог предположить во что выльется интернет как межсетье. Заменить все это легаси и технологический долг можно только одним способом: все выкинуть и построить новый Интернет с нуля. Без совместимости.
Ну расскажите что бы вы улучшили в протоколе TCP IP? (на самом деле это два разных уровня).
> Сейчас бы ни кому в голову не пришло такое написать, как и сделать такую DNS, такие OSPF и BGP.
Расскажите что бы вы сделали. Я бы с удовольствием послушал. Особенно как бы вы заменили BGP, ну и DNS.
Заменить все это легаси и технологический долг можно только одним способом: все выкинуть и построить новый Интернет с нуля. Без совместимости.Вы видимо дальше первой страницы книжки не читали. С дивана то магистральные маршрутизаторы по $10kk за юнит легко заменить с нуля. Это конечно смешно, когда совершенно безграмотные люди лезут учить как правильно делать сети.
Даже отвечать не хочется... Я не писал, что заменить все это легко или возможно. А так... стандартный инфоцыганский подход, заклеймить собеседника безграмотным диванным аналитиком и пренебрежительно поставить нам место. Сами то небось двадцать лет в ростелекоме циски конфигурили? Откуда вам знать мою биографию? Может я еще ЯУЗ и PL/1 помню, или BGP настроить могу?
ЯУЗ — это что? JCL, что ли? А давайте тест проведем — что такое "ПКЫ"?
язык управления заданиями, ес эвм. Школоло?
Погодите — вы знаете ЯУЗ, но не знаете JCL? Если так, то еще неизвестно, кто тут из нас школоло.
Толстая книжка по System/360 у меня где то есть. В школе я учился в 80-х. В школьном машзале:
Собственная ЕСка в школе, ого. Не знал, что были такие школы. Я ЕСку только в институте увидел.
Наверное это уникальный случай. СШ №1, г. Югорск.
Я ни секунды не сомневался, что это была московская школа. :) Вот те нате. Это тот Югорск, который в ХМАО?
Да, в какой-то момент Тюменьтрансгаз, по моему, получил спарку 1045, плюс там были еще машины, а ЕС1030 отдал в школу. А далее уже к 1990 в школе появились ЕС-1840
16-разрядный IBM PC-совместимый компьютер построенный на процессоре К1810ВМ86 (аналог Intel 8086) с тактовой частотой 4,77 МГц.
В 89-м, кажется, году у нас в конторе в ответ на наши "давайте уже купим РС" появилась ЕС1840. Первое, что мы попытались сделать — это запустить на ней F-19 Stealth Fighter, а это было не очень просто, потому что оно не помещалось на дискеты 720К, а только на 1.44М. Как-то удалось разбить на 2 дискеты, запустили, а оно меееееееедленное. Ну т.е. запускаешь ракету, и она полчаса висит у тебя перед носом, медленно удаляясь. В итоге сказали руководству, что нет, очень слабый компьютер, работать невозможно, надо другой. :) Потом уже нормальная АТшка появилась.
UPD. Насчет емкости дискет мог ошибиться — там, кажется, 5" были. Но смысл тот же.
Да, F19, F16 с микроквадратом для полетов, потом retaliator и самое лучшее - TORNADO от Digital Integration - все это было в ходу). Тем более что рядом с Югорском находилась авиабаза 763 ИАП, с новейшими на тот момент МИГ-31 и "полномасштабным" симулятором в здании. Все это 87-90 годы. ПК - венгерские ТАПы, немецкие Амстрады и еще какой-то зоопарк...
Нескучное было время!
Точно!