World Backup Day, или песнь о человеческой беспечности

В конце марта – а конкретно 31 марта, за сутки до дня искромётных шуток про белую спину — весь мир отмечает очень нешуточный день: так называемый World Backup Day. Иначе говоря, международный день резервного копирования. Этот день по своему назначению должен привлечь внимание общественности, как широкой, так и узкоспециализированной, к вопросу сохранения информации. Как вообще хранить данные, если и форматы, и носители информации постоянно стареют? Рассказываем в нашей статье.

Источник gocorptech.com

Первое апреля

Вообще сразу скажем, что 31 марта в 2011 году было выбрано всем Reddit’ом для Дня бэкапа совсем не случайно. Первое апреля действительно во многих странах – это день шуток, и они бывают совсем не безобидными. Например, то и дело как раз 1 апреля различные нехорошие люди запускают вирусы, и вот сразу возникают и сбои в системе, и потеря информации, зачастую очень ценной.

Как известно, люди делятся на два типа: те, кто ещё не делают бэкапы, и те, кто их уже делает. Действительно, человеческая беззаботность порой не знает пределов, и сохранять нужное в нескольких копиях приходит в голову тогда, когда нужное уже потеряно, причём порой безвозвратно.

Безжалостная статистика говорит следующее: около 30 процентов людей вообще никогда и ни при каких обстоятельствах не проводили резервного копирования. Чуть меньше, 29 процентов данных теряется из-за случайного удаления, которое вовремя не заметили и не успели откатить. А вирусами заражается ежемесячно каждый десятый компьютер.

Один из вариантов баннеров ко Дню резервного копирования. Источник afterdawn.fi

Регулярное резервное копирование данных — это что-то вроде правила хорошего тона в современном мире. Но у этого процесса есть дополнительная сложность, на первый взгляд неочевидная. И это формат хранения данных. Многие из читающих этот текст, скорее всего, помнят такие носители информации, как дискеты, и порой что-нибудь на них сохраняли. Эти многие, мы думаем, согласятся с тем, что для чтения дискеты в настоящее время нужно очень и очень постараться: техника убежала уже изрядно далеко вперёд. И это за какие-то двадцать лет. А что будет через пятьдесят лет? Через сто?

3–2–1, поехали!

Основное правило бэкапов звучит как «3–2–1». Но это не секунды до пуска ракеты или другого старта; это короткий метод запомнить следующее: для обеспечения надёжного хранения данных нужно иметь:

  • три резервные копии этих данных;
  • эти копии должны быть минимум в двух различных форматах хранения;
  • одна из копий должна храниться удалённо.

Автором этого правила считается некий Питер Крог, сформулировавший его в своей книге «Управление цифровыми активами для фотографов». Вполне понятно, почему резервным хранением озаботился представитель именно этой профессии: для человека снимающего потеря архива — это практически катастрофа. Все три части правила базируются на принципе обеспечения отказоустойчивости через избыточность хранения данных. Если посидеть и посчитать, то в случае реализации такого хранения данных при утроении вероятности сбоя совокупности копий надёжность будет возрастать кубически.

Источник youtube.com

Правда, стоит заметить, что угрозы устройствам хранения в этом случае должны быть статистически независимы друг от друга. А в реальной жизни зачастую эта зависимость угроз как раз будет существовать. Например, если в цепи питания возникает электромагнитный импульс, то он одинаково действует на все подключённые к нему устройства — допустим, на жёсткий диск компьютера и на какой-нибудь внешний диск. Или если у вас настроена автоматическая репликация данных, то при заражении оригинала копия будет так же испорчена вирусом. Или вообще случается пожар, а фотографии и тексты есть в компьютере и в бумаге, на которые огонь распространяется одинаково.

В общем-то, именно поэтому в правиле есть единица, обозначающая удалённое хранение — оно снижает вышеописанную статистическую зависимость угроз разным копиям данных через географическое распределение мест хранения. Говорим «удалённо» — подразумеваем «облако». И да, облачное хранение вполне подходит для целей резервного копирования, но только как один из вариантов хранения: здесь можно вспомнить о возможности и утери паролей, и взлома хранилища, и решения компании уйти из юрисдикции той или иной страны.

Хранить вечно?

На день сегодняшний мы не можем уверенно утверждать, что тот или иной физический носитель сможет на века сохранить цифровые данные — вернее, различные производители это вполне утверждают, однако же цифровые данные просто слишком недавно в мире появились в принципе. Магнитные диски со временем могут размагнититься, полупроводниковые накопители — потерять заряд, оптические диски тоже вполне могут прийти в негодность.

Чтение компакт-дисков, например, далеко не на каждом ноутбуке ныне возможно. Источник pixy.org

Что касается форматов, над ними тоже приходится думать. Форматы хранения данных устаревают, это раз; при переходе с одной операционной системы на другую часть документов могут перестать считываться, это два; в конце концов, программы и приложения для чтения того или иного документа тоже запросто могут устареть.

Нужно выбирать вариант, который чисто в теории может быть долговечнее. По большей части стоит обращать внимание на открытые форматы, то есть на те, где документ, созданный в приложении, может быть прочитан и без оного приложения, то есть всякий .xlm, .pdf., .txt и прочие.

Migration vs emulation

К решению вопроса об электронном хранении документов существует два классических на данный момент подхода: это миграция (migration) и сохранение окружения (emulation). Сейчас коротко расскажем, что это.

Что такое миграция? Суть этого подхода в том, что мы выбираем какой-то единый формат архивного хранения документов. Плюс этого подхода в том, что мы всегда можем обеспечить доступность средств для просмотра этих самых документов; минус же в том, что формат накладывает свои ограничения. В текстовом варианте представить можно далеко не всё — а как же фотографии, как же видео, базы данных? Как же форматы, которые ещё не изобретены — например, для передачи запахов? Для этого всего нужно будет снова выбирать предпочтительный формат и обеспечивать всю дальнейшую совместимость. Вдобавок те форматы, которые мы уже выбрали, всё равно будут устаревать, и данные нужно будет переводить на новые платформы.

Источник habrastorage.org

Вариант с сохранением окружения другой: это создание эмуляции аппаратной платформы, операционной системы и всего набора программ, необходимого для правильного воспроизведения тех или иных документов. Условно говоря, мы просто создаём всю экосистему в том виде, в котором она у нас есть. Однако и здесь нас настигает старение форматов – виртуальные машинки, понятно дело, тоже будут стареть.

Так или иначе, любой подход к сохранению данных начинается с того, что о сохранении данных надо заботиться. Никакая волшебная программа или бездушная машина данные за человека не сохранит. Поэтому мы призываем вас помнить о необходимости хранить самое ценное, делать бэкапы важной для вас информации — например, в нашей надёжной Цифровой капсуле времени, где мы как раз усердно блюдём правило «3–2–1» ;)

0
Комментарии
-3 комментариев
Раскрывать всегда