Реализация доступности данных и приложений с помощью резервного копирования

22. 08. 2016

Наблюдая за модернизацией дата-центров в течение последних лет, можно увидеть огромный шаг в процессах резервного копирования и связанных с ними методов работы. Виртуализация дата-центров открыла множество возможностей для резервного копирования, позволив новым поставщикам предоставлять инновационные решения: более эффективные, не использующие агентов и требующие меньших расходов, чем традиционные системы.

Говоря о традиционных системах резервного копирования, мы обычно имеем в виду использование агентов, устанавливаемых в операционную систему. Большинство традиционных систем резервного копирования, использующие агентов, выполняют копирование на уровне файлов. Объем резервного копирования на уровне файлов определяется администраторами или пользователями. В ходе резервного копирования обрабатываются только выбранные данные, а все остальные игнорируются. Резервное копирование на уровне файлов делает процесс в целом более гибким, но послеаварийное восстановление может оказаться очень трудоемким, если необходимо восстановить все данные на исходном носителе. Традиционные методы резервного копирования могут использоваться в современных дата-центрах, ведь иногда это единственный возможный вариант для оставшихся физических серверов. Однако для виртуальных платформ с высокой степенью консолидации они совершенно неэффективны и часто дают сбои.

Одно из важнейших отличий современных технологий защиты данных от традиционного резервного копирования в том, на каком уровне они используются. В отличие от традиционных способов, которые выполняют резервное копирование внутри операционной системы, современные стратегии защиты данных действуют в основном на уровне виртуальной среды, делая ненужной установку агентов на источнике. Другое важное различие между традиционными и современными решениями — способ передачи данных с источника на целевое устройство. Традиционные способы обычно используют передачу по сети. Современные решения отличаются высокой степенью виртуализации.Такие современные способы работы не только снижают нагрузку на производственные ВМ при выполнении резервного копирования, но и уменьшают объем трафика в рабочей сети, если настроена специальная сеть для резервного копирования.

Самые современные решения для защиты данных работают в зависимости от типа выполняемого резервного копирования. Сначала виртуальные машины «замораживаются» с помощью службы Microsoft Volume Shadow Copy Service (VSS) или, при необходимости, инструментов VMware для создания консистентной резервной копии. Затем делается снимок виртуальной машины, который позволяет перенаправить актуальные данные на отдельный диск во время копирования оригинала. После этого определяется режим передачи данных резервной копии, сопоставляются источник и целевое хранилище и выполняется резервное копирование соответствующего типа (полное или инкрементное). При инкрементном резервном копировании используется технология отслеживания измененных блоков данных VMware для определения измененных блоков. Их можно также вычислять с помощью внутренних возможностей ПО для резервного копирования. Данные резервных копий проходят сжатие и дедупликацию (во время копирования или по его завершении) и затем хранятся в соответствии с политиками хранения.

Передовые способы использования снимков виртуальных машин
Основные преимущества снимков виртуальных машин VMware - они позволяют быстро создать точку восстановления работающей машины. Сохранив такую точку восстановления, можно устанавливать обновления или вносить другие изменения в виртуальные машины, и если что-то пойдет не так, изменения всегда можно будет откатить к указанному моменту времени. Технология снимков VMware также очень важна для систем резервного копирования, поэтому поставщики придумывают разные варианты ее использования в своих решениях. Чаще всего используются два способа.

1. Резервное копирование с помощью снимков VMware
Использование снимков VMware — наиболее частый на сегодня метод резервного копирования виртуальной среды. Создавая снимок виртуальной машины средствами VMware, такие поставщики, как Veeam, обрабатывают данные с диска, предназначенного только для чтения, в то время как виртуальная машина продолжает работать и записывает данные в журналы обновлений (redo logs).
Обычный порядок использования снимков виртуальной машины в решениях для защиты данных выглядит так:

  • Создается снимок виртуальной машины. Все процессы записи на исходные диски, подключенные к ней приостанавливаются, а диски помечаются как предназначенные только для чтения.
  • Для каждого подключенного к виртуальной машине диска создается журнал обновлений (иногда его также называют дочерним диском). Чтение и запись любых новых или измененных блоков данных будут производиться в журнале обновлений и регистрироваться в файле метаданных журнала изменений: это позволяет определить, какие блоки были изменены во время использования снимка виртуальной машины.
  • После создания журнала обновлений сервер резервного копирования может начать обработку данных на диске, предназначенном только для чтения.
  • После обработки всех данных отправляется запрос на удаление снимка. При удалении все новые или измененные блоки копируются соответствующий на исходный диск, а журналы обновлений удаляются.

Снимок vmware

2. Резервное копирование с помощью аппаратных снимков
Такие поставщики систем резервного копирования, как Veeam, проанализировали проблемы, связанные с собственными снимками VMware, и предложили свои решения для минимизации времени существования снимка. Для этого они обеспечили в своем продукте поддержку резервного копирования из снимков VMware, находящихся в аппаратных снимках хранилищ (иногда их называют снимками SAN или LUN), в то время как снимок рабочей виртуальной машины VMware уже может быть слит с исходной виртуальной машиной. Помимо преимуществ, которые дает сокращение времени использования снимка VMware, аппаратные снимки позволяют сократить общее время резервного копирования: по завершении работы не требуется сливать большие снимки с рабочей виртуальной машины, поэтому система резервного копирования не использует стек гипервизора, а подключается прямо к хранилищу.
Резервное копирование с помощью аппаратных снимков выполняется следующим образом:

  • Создается снимок на уровне виртуальной машины, при этом все операции записи перенаправляются во вновь созданные журналы обновлений, а исходные диски переводятся в состояние только для чтения. Хотя резервное копирование выполняется на уровне аппаратного снимка, снимок виртуальной машины все равно необходим для обеспечения целостности приложений в операционной системе.
  • Создается аппаратный снимок тома LUN/хранилища, который содержит как исходные диски только для чтения, так и вновь созданный снимок VMware.
  • После этого снимок VMware в исходном томе LUN/хранилища сразу же удаляется. После этого виртуальная машина работает в обычном режиме, и резервное копирование не влияет на ее производительность или на место в хранилище.
  • В свою очередь сервер резервного копирования может обработать созданный клон виртуальной машины в аппаратном снимке и завершить резервное копирование.
  • После завершения работы аппаратный снимок, созданный на втором этапе, также удаляется. Как мы установили, при использовании резервного копирования с помощью аппаратных снимков снимки VMware будут использоваться менее продолжительное время — только до создания аппаратных снимков, что обычно происходит довольно быстро. После этого снимки удаляются, во время резервного копирования они уже не потребуются.

Резервное копирование с помощью аппаратных снимков

Хранение резервных копий
Объем данных в современных дата-центрах постоянно растет, и одновременно увеличивается необходимое пространство для резервного копирования этих данных. Поставщики систем резервного копирования используют различные схемы записи резервных копий на диск для решения проблемы растущих объемов и экономии места. Рассмотрим наиболее часто используемые схемы хранения данных резервных копий.

Полная резервная копия
Полная резервная копия — это резервная копия на уровне образа, которая включает все диски виртуальной машины и содержащиеся на них данные. Она занимает очень много места, поскольку в каждом цикле выполняется полное резервное копирование всех данных и конфигурации. Резервное копирование выполняется каждый раз независимо от предыдущих циклов, а для восстановления данных не требуется наличие других резервных копий.

Полная резервная копия

Инкрементная резервная копия
Используя инкрементные резервные копии, компании выполняют резервное копирование только тех блоков данных, которые были изменены с момента предыдущего копирования. Такие резервные копии занимают гораздо меньше места в репозитории и создаются гораздо быстрее, чем полные копии.

Инкрементная резервная копия

Инкрементная резервная копия с активной/синтетической полной копией
Иметь одну полную резервную копию со множеством привязанных к ней инкрементных копий — перспективная стратегия, но некоторые компании предпочитают время от времени делать новые полные резервные копии на тот случай, если с исходной полной копией что-то случится. Такие системы резервного копирования, как Veeam Backup & Replication, предлагают возможности для реализации такой стратегии с помощью еще одного режима, сочетающего создание регулярных полных резервных копий с инкрементными. Наличие нескольких полных резервных копий добавляет компаниям уверенности. Такой режим обеспечивает компаниям дополнительную надежность благодаря наличию на диске нескольких полных резервных копий, однако для этого требуется несколько раз выполнять полное резервное копирование рабочей виртуальной машины.

Инкрементная резервная копия с активной/синтетической полной копией

Обратная инкрементная резервная копия
В первый раз, как и в других режимах, выполняется полное резервное копирование, а в следующих циклах создаются инкрементные копии. Однако вместо того, чтобы хранить на диске изменившиеся блоки данных, инкрементные копии сливаются с исходной полной копией. При этом предыдущая версия тех блоков данных, которые были изменены, сохраняется в обратной инкрементной копии. На диске постоянно хранится самая свежая полная резервная копия, и это позволяет при необходимости быстро восстановить данные из последней копии, а инкрементные копии содержат те блоки данных, которые необходимо наложить на полную копию, если необходимо восстановить данные на более ранний момент времени.

Обратная инкрементная резервная копия

Инкрементная резервная копия с активной/синтетической полной копией и преобразованием
Этот режим резервного копирования представляет собой сочетание инкрементного резервного копирования, синтетической полной копии и обратного инкрементного резервного копирования. На этапе преобразования все инкрементные и полные резервные копии, полученные до создания последней полной копии, превращаются в обратные инкрементные копии.

Инкрементная резервная копия с активной/синтетической полной копией и преобразованием

Прямое постоянно инкрементное резервное копирование
Режим прямого постоянно инкрементного резервного копирования в Veeam Backup & Replication сочетает в себе стратегию использования инкрементных копий с созданием синтетической полной копии. При первом выполнении задания резервного копирования создается полная резервная копия. Все последующие резервные копии являются инкрементными и включают только блоки данных, измененные с момента создания предыдущей полной или инкрементной копии.

Прямое постоянно инкрементное резервное копирование

Политика «дед, отец, сын» (GFS)
Многие компании должны или хотят сохранять еженедельные, ежемесячные, ежеквартальные или ежегодные резервные копии своих данных, чтобы обеспечить наличие определенных точек восстановления в целях безопасности или исполнения нормативных требований. Для этого компании часто разворачивают основное хранилище на небольших и быстрых целевых устройствах, а дополнительное хранилище используют для размещения более старых точек восстановления с длительным сроком хранения. Долгосрочное хранение этих более старых копий обычно осуществляется по так называемому принципу «дед, отец, сын» (GFS).
GFS — это многоступенчатый цикл хранения, который обеспечивает компании хранение еженедельных, ежемесячных и ежегодных резервных копий в дополнение к политике краткосрочного хранения. В этой схеме еженедельные копии соответствуют сыну, ежемесячные — отцу, а ежегодные — деду. Такие поставщики систем резервного копирования, как Veeam, обеспечивают поддержку политики хранения по принципу GFS в своих решениях с помощью своей технологии архивирования резервных копий. Задания архивирования резервных копий дают компании возможность создавать синтетические резервные копии на основе данных основного задания резервного копирования, но в дополнительном хранилище. Сочетание архивирования резервных копий с хранением по принципу GFS позволяет компаниям при необходимости соблюдать требования политик хранения к наличию определенного числа еженедельных, ежемесячных и ежегодных резервных копий отдельно от хранилища текущих точек восстановления.

Дедупликация данных
Дедупликация — это технология, которая избавляет от необходимости хранить дублирующиеся, то есть идентичные блоки данных. В решениях Veeam реализована дедупликация на стороне источника. В этом случае блок данных записывается на диск только один раз, а при его повторном обнаружении на источнике вместо записи тех же самых данных делается запись метаданных со ссылкой на первый блок.

Дедупликация данных

Сжатие данных
Сжатие данных— еще одна технология, используемая в системах резервного копирования для экономии дорогостоящего дискового пространства в репозиториях. Она позволяет уменьшать размер файлов, в том числе и файлов резервных копий. Разумеется, файлы одних типов сжимаются лучше, других — хуже, а степень сжатия может зависеть от содержимого файлов. Некоторые поставщики систем резервного копирования, такие как Veeam, предлагают возможность пользовательской настройки степени сжатия для отдельных заданий. Благодаря этому компании могут либо использовать максимально возможное сжатие, либо задать более низкую степень для повышения коэффициента дедупликации и более эффективной поддержки WAN-акселерации.