Я понимаю аргумент, касающийся увеличения вероятности появления URE на больших дисках во время перестройки, однако я не уверен, каковы реальные последствия для этого. Этот ответ говорит о том, что полное восстановление не удалось, но означает ли это, что все данные недоступны? С чего бы это? Конечно, один URE из одного сектора на диске может повлиять только на данные, относящиеся к нескольким файлам, в лучшем случае. Разве массив не будет перестроен, просто с небольшим повреждением нескольких файлов?
(Я особенно заинтересован в реализации RAID5 в ZFS здесь, но логика кажется одинаковой для любой реализации RAID5.)
raid
zfs
zfsonlinux
process91
источник
источник
Ответы:
Это действительно зависит от конкретной реализации RAID:
большинство аппаратных RAID прервет реконструкцию, а некоторые также пометят массив как сбойный , что приведет к его отключению. Смысл заключается в том, что если URE происходит во время RAID5 восстановить это означает , что некоторые данные будут потеряны, так что лучше , чтобы полностью остановить массив , а что рискует беззвучное искажение данных. Примечание: некоторые аппаратные RAID (в основном на базе LSI) вместо этого будут пробивать массив, позволяя продолжить перестройку, помечая уязвимый сектор как нечитаемый (аналогично тому, как ведет себя программный RAID Linux).
В программном RAID-массиве Linux можно указать: а) прекратить перестройку массива (единственное поведение "древних" сборок MDRAID / ядер) или б) продолжить процесс перестройки, помечая некоторые LBA как плохие / недоступные. Обоснование состоит в том, что лучше позволить пользователю делать свой выбор: в конце концов, один URE может находиться в свободном пространстве, не затрагивая данные вообще (или затрагивая только несущественные файлы);
ZRAID покажет какой - то файл , как поврежденные, но она будет продолжать процесс перестроения (см здесь для примера). Опять же, обоснование заключается в том, что лучше продолжать и сообщать пользователю, что позволяет ему сделать осознанный выбор.
источник
Если произойдет URE, вы столкнетесь с некоторым повреждением данных в блоке размером 256 КБ-1 МБ, но это не означает, что ВСЕ данные на вашем томе будут потеряны. Что не так хорошо в RAID5, это совсем другое: сама перестройка вызывает стресс, и есть большие шансы, что вы получите второй сбой диска подряд. В таком случае все данные будут потеряны.
источник
Я бы объяснил это наоборот;
Если контроллер RAID не останавливается на URE, что может произойти?
Я жил на сервере, RAID никогда не замечал URE, и после восстановления началось повреждение на всем томе RAID.
После восстановления диск стал становиться более поврежденным, и данные начали повреждаться.
Диск никогда не был сброшен с тома RAID, сбой контроллера - это задача по защите целостности данных.
Этот пример написан, чтобы заставить вас думать, что контроллер вообще не может использовать том с URE для обеспечения целостности данных, так как том предназначен не для резервного копирования, а для устойчивости к отказу диска
источник
Я бы посоветовал прочитать этот вопрос и ответы на него, чтобы узнать больше. Затем перейдите и перечитайте вопрос, который вы связали снова.
Когда кто-то говорит об этой ситуации, что «сбой RAID», это означает, что вы потеряли преимущество RAID - вы потеряли постоянный доступ к данным, из-за чего вы изначально создали RAID-массив.
Вы не потеряли все данные, но наиболее распространенный способ восстановления с одного мертвого диска плюс (некоторые) URE на (некоторых) оставшихся дисках - это полное восстановление массива с нуля, что будет означать восстановление всех ваших данных из резервной копии.
источник