Duplicity Полная резервная копия Срок службы и эффективность

17

Я пытаюсь разработать стратегию резервного копирования для некоторых клиентов и склоняюсь к двуличности для удаленного резервного копирования (уже используется rdiff-backup для внутреннего / локального резервного копирования).

Разумно ли хотеть время от времени делать полную резервную копию? Поскольку дублирование увеличивается вперед, каждая инкрементная резервная копия зависит от предыдущего приращения, и все в значительной степени зависят от последней полной резервной копии. Если это станет коррумпированным, случатся плохие вещи. Смежный вопрос: проверяет ли Duplicity последовательные резервные копии на согласованность?

Предполагая, что я все время хочу полное резервное копирование, насколько эффективно дублирование создает такое полное резервное копирование? Может ли он проверять подписи файлов и копировать неизмененные данные из предыдущих полных резервных копий / приращений? По сути, создаете новый «полный» архив, передающий новые / измененные данные и объединяющий существующие неизмененные данные?

Сейчас я обеспокоен тем, что необходимо выполнить полное резервное копирование, но постоянное использование полных резервных копий с большой пропускной способностью сделает это необоснованным для некоторых клиентов.

Тим Лайтл
источник

Ответы:

8

Я думаю, что разумно хотеть делать полное резервное копирование время от времени: большинство моих машин настроено на резервное копирование каждые несколько месяцев. В этом числе нет ничего волшебного: правильное значение будет зависеть от того, сколько данных у вас есть, как быстро они меняются, какова вероятность того, что вы захотите восстановить что-либо, кроме самого последнего снимка, сколько вам стоит трафик и хранилище и как ты параноик. Другие люди могут захотеть полную резервную копию каждую неделю.

Если вы не делаете полное резервное копирование время от времени, размер архива и время восстановления будут продолжать расти.

Я не думаю, что у duplicity есть команда "check" http://pad.lv/660895 , но было бы неплохо, если бы это было так. Очень разумно делать тестовое восстановление время от времени.

С этим связан вопрос, следует ли хранить более одной резервной цепочки. Опять же, это зависит от стоимости. Одна из причин, по которой стоит оставить эту проблему, заключается в том, что вы можете восстановить ее, если текущая цепочка повреждена из-за аппаратного сбоя, сбоя ОС или ошибки дублирования. Конечно, если старая цепочка очень старая, восстановление из нее может иметь ограниченную ценность.

Создание полной резервной копии всегда загружает полную копию данных.

Если проблема клиента связана с используемой пропускной способностью, а не с трафиком, вы можете запустить ее, например, в trickle.

poolie
источник
2
У Duplicity теперь есть команда проверки: help.ubuntu.com/community/DuplicityBackupHowto#Verify
Eli
5

То, что вы запрашиваете, называется синтетической полной резервной копией , которая относится к процессу получения полной резервной копии путем объединения инкрементной резервной копии с предыдущей полной резервной копией на стороне назначения (т. Е. На сервере резервного копирования).

Я не знаком с Duplicity, но на их сайте он, похоже, не делает синтетических полных резервных копий. Вы должны сохранить все инкрементальные значения в полной мере, на которых они основаны. Если это так, то вы, вероятно , хотите , чтобы заставить полное резервное копирование каждый так часто, так как :

  • Прохождение миллиона приращений, вероятно, замедлит восстановление
  • Вы, вероятно, не хотите, чтобы приращения возвращались к началу времени

Один интересный способ для достижения синтетического Фуллса заключается в использовании Rsync с --link-Dest = DIR вариантом, или использовать rsnapshot . Он будет хранить только различия между каждой инкрементной резервной копией, но каждая будет выглядеть полной. Когда вы удаляете любой из них, он автоматически объединяет инкрементные файлы соответствующим образом. Это происходит благодаря магии жестких ссылок, поэтому различия будут основаны на файлах (либо файл был изменен и включен в diff, либо нет).

lukecyca
источник
Это оставляет меня с одним вопросом, как я могу использовать двуличие для шифрования, но при этом иметь синтетическую резервную копию. Кажется, что двуличность действительно имеет совместимость с rsync, но это трудно понять .. @poolie
user1226868