Нужно ли выполнять проверку резервных копий на ленте LTO, даже если сами диски выполняют проверку при записи?

8

У нас есть ленточный накопитель LTO-3 в медиатеке Dell, который мы используем для резервного копирования на ленту. В статье о LTO в Википедии говорится, что:

LTO использует технологию автоматической проверки после записи для немедленной проверки данных во время их записи, но некоторые системы резервного копирования явно выполняют совершенно отдельную операцию чтения с ленты, чтобы убедиться, что лента была записана правильно. Эта отдельная операция проверки удваивает число сквозных проходов для каждой запланированной резервной копии и уменьшает срок службы ленты вдвое.

Я хотел бы знать, нужно ли мне программное обеспечение для резервного копирования (в данном случае Backup Exec) для выполнения проверки на этих лентах или достаточно технологии проверки после записи, присущей накопителям LTO?

Мне также было бы любопытно, если Backup Exec понимает технологию проверки после записи достаточно, чтобы предупредить меня, если эта технология не может улучшить данные или просто игнорирует их, что делает их бесполезными в любом случае, так как даже если диск обнаружит проблему, я никогда не буду знать об этом.

Крис Магнусон
источник

Ответы:

10

Отличный вопрос!

Хотя я бы сказал, что да, вы должны их протестировать, я бы сказал, что тестирование лент / накопителей само по себе очень важно, и гораздо важнее тестирование сквозного процесса восстановления .

Я не могу рекомендовать достаточно регулярных полных восстановлений системы и сервисного тестирования, это единственный способ точно знать , что вся система делает то, для чего вы ее купили. Вам не нужно далеко заходить на этот сайт, чтобы увидеть людей, которые пытаются восстановить свои услуги, даже если они думали, что они прошли все этапы индивидуально.

Надеюсь это поможет.

Chopper3
источник
1
+1 за восстановление. В этот момент я присоединяюсь к "виртуальным машинам!" - восстановление на виртуальную машину может быть хорошим индикатором бесперебойной работы вашей резервной копии
Sirex
1
То, что вы говорите, определенно является хорошей идеей, и мы должны начать это делать, но я все еще не уверен, приведет ли технология проверки на запись в дисках LTO 3 к сбою моего резервного копирования, если по какой-либо причине данные не могут быть проверены так же, как если бы произойдет, если мое программное обеспечение для резервного копирования выполнит проверку данных. Мне нравится идея делать что-то большее, но мне все еще нужно знать, делаю ли я в настоящее время что-то избыточное, в котором нет необходимости. Спасибо
Крис Магнусон
1
Также убедитесь, что вы выполняете восстановление с использованием другого ленточного накопителя, отличного от резервного копирования, поскольку некоторые ленты могут быть прочитаны только на том накопителе, который их сделал (или, по крайней мере, это было возможно в прошлом).
Джеймс
@ChrisMagnuson Вы когда-нибудь узнавали, что происходит, если привод обнаруживает ошибку, используя собственную схему проверки после записи?
alx9r
1
@ alx9r Боюсь, что нет. Похоже, никто не знает наверняка, и я не уверен, как вы можете преднамеренно испортить данные сразу после того, как они были записаны головкой ленты, но до того, как они будут прочитаны каким-либо механизмом, который выполняет проверку после записи, чтобы вы могли видеть как ваше программное обеспечение для резервного копирования реагирует на обнаруженную ошибку.
Крис Магнусон
1

Прежде всего, эта автоматическая проверка не заменяет сквозную проверку. Я видел диски, поставленные с ошибкой прошивки, которая приводила к тому, что чтение восстановления было менее надежным, чем чтение проверки.

Результатом этого стало то, что вы могли записывать ленты без каких-либо сообщений об ошибках, но при попытке восстановления вы увидите, что чтения читаются с ошибками или снижением скорости на несколько порядков.

Большинство клиентов никогда не замечали эту ошибку прошивки. По словам продавца, потому что клиенты на самом деле не выполняли тестовые восстановления. Эта конкретная ошибка была исправлена. Но я уверен, что мы не видели последнюю ошибку прошивки, и некоторые ошибки прошивки будут обнаружены, только если вы действительно протестируете реальное чтение.

В случае сбоя проверки происходит следующее: микропрограмма автоматически записывает вторую копию (и во время восстановления прошивки прозрачно на хост возвращает только одну из двух копий). Это означает, что доступная емкость зависит от работоспособности накопителя и качества носителя.

Если при проверочном чтении происходит слишком много попыток записи, об ошибке сообщается на уровне SCSI. Можно было бы подумать, что об ошибке, о которой сообщают, таким способом трудно пропустить на программном уровне, но ошибки в путях кода, которые только вызваны ненадежным оборудованием, общеизвестно трудны для проверки.

kasperd
источник