В дисковом массиве RAID 5 восстановление диска увеличивает вероятность отказа другого диска?

2

Если у вас есть основной массив RAID 5 из 3 или более жестких дисков, и один из них выходит из строя, увеличивает ли это вероятность сбоя одного из других дисков и делает невозможным полное восстановление? Если каждый из дисков читается в процессе восстановления, повышает ли это вероятность их отказа, если они активны только небольшую часть дня?

Если это влияет на стабильность во время восстановления, я могу рассмотреть RAID 6. Кроме того, есть ли преимущество или недостаток использования RAID 5 вместо RAID 4? Это кажется более организованным для использования RAID 4 и более распространенным для использования RAID 5.

Феникс Логан
источник
RAID 6 явно лучше, если вы можете себе позволить такую ​​стоимость.
Кибернард

Ответы:

3

Прежде всего, если вы настроены на паритетный рейд, я бы порекомендовал RAID 5 с автоматической схемой резервного копирования поверх RAID 6. Резервное копирование может выполняться на нескольких дисках (рекомендуется), RAID 0 (не рекомендуется) или другом RAID 5. Это обеспечивает хороший баланс затрат и безопасности для ваших данных, поскольку он также может справиться со сбоями контроллера и человеческими ошибками.

Что вы будете делать безопасно, зависит от размера вашего массива

Многие в ИТ-индустрии уходят от RAID 5 по двум причинам. Во-первых, размер сдвига во многих массивах требует очень долгого времени перестройки, что открывает окно на второй сбой. Второй - это проблема URE, которая является неисправимой ошибкой чтения, которая не известна до тех пор, пока не удастся прочитать блок, а затем весь массив на этом диске станет нечитаемым. Опять же, URE случаются редко с точки зрения количества сдвигов ошибок на считанные биты, но когда у вас есть массивы размера TB, редко бывает слишком часто. Массив не может быть восстановлен с диска с URE. Таким образом, если у вас есть сбой и URE, у вас фактически есть 2 неисправных диска. RAID 6 помогает в этом, потому что вы можете потерять два диска и все равно восстановить массив.

Но если у вас есть массив 100 ГБ в RAID 5, эти проблемы значительно уменьшаются, и RAID 5 становится более жизнеспособным; однако, если у вас есть массив 100 ТБ (просто в качестве примера) на рейде 6, вам может потребоваться дополнительная избыточность или другой вариант!

RAID 5 с массивами TB определенно является игрой, и я бы не стал доверять. И нет смысла запускать RAID 6 с четырьмя дисками вместо RAID 10, если вы не собираетесь в ближайшее время расширять свой массив и вам необходимо делать это по одному диску за раз по цене. И давайте не будем забывать, что вы можете запускать несколько массивов RAID 1, он просто разделяет ваши данные на отдельные разделы / диски, с которыми вам нужно работать, и лишает удобства одного большого диска.

Но все имеет свои предостережения. Чем больше RAID 5, тем выше (экспоненциально выше) вероятность сбоя восстановления из-за отказа второго диска или URE. RAID 6 дороже и сложнее. RAID 10 дороже пока (но для простоты). И несколько RAID 1 для удобства.

В конце концов, вам нужно определить свои потребности, разделить то, что вы не можете потерять, и то, что вы нормально теряете. Сопоставьте это с бюджетом и уровнем знаний, выбирая, какой массив выбрать.

Мы помещаем наши офисные и домашние данные на RAID 1 (на самом деле 2 диска RAID 10 с MD RAID) для обеспечения безопасности при ежедневном резервном копировании. это просто, быстро и надежно. Любые другие данные, такие как видеофайлы или другие большие некритические файлы, которые мы помещаем на RAID 5 или на отдельные диски с периодическим резервным копированием в зависимости от того, насколько важны данные, потому что мы не хотим обеспечивать такой же уровень безопасности в наших фильмах, как и наши семейные фотографии и / или файлы наших компаний.

Damon
источник
Проблема в том, что я создаю онлайн-сервис резервного копирования для большого количества клиентов. Я не могу на самом деле разделить данные между RAID 5 и RAID 1, потому что он разработан и продается с высокой степенью безопасности (до того момента, когда пароль никогда не отправляется на сервер и не сохраняется, и то же самое с ключом шифрования). Это своего рода разрушает, спрашивая, насколько важен каждый раздел их файлов для моих клиентов. Будет ли безопасно сохранять паритет для каждых 2-х обычных дисков? Я хочу, чтобы это было безопасно, но также и экономически эффективно. Я бы сделал RAID 1 (это была моя первая мысль), но RAID 5 экономит нам 25%.
Феникс Логан
RAID 6, кажется, не экономит больше места, чем RAID 6. Мне все еще нужно удвоить то, что на самом деле хранится. RAID 5 кажется лучшим вариантом, пока я сохраняю соотношение дисковых накопителей и дисков четности. 3: 1? Кроме того, мне интересно, размер дисков влияет на что-нибудь? Вероятно, они не будут превышать 2 ТБ, но увеличит ли накопитель больший вес для безопасности восстановления?
Феникс Логан
Если хранилище предназначено для платных клиентов, то никакие данные не расходуются, и простая установка RAID не будет достаточно безопасной. RAID просто позволяет приводу выйти из строя и данные не будут потеряны; он не охватывает бесконечный сбой диска, сбой массива из-за повреждения, сбоя оборудования или человеческой ошибки. Вот тут-то и появляются такие вещи, как настройки HA с DRBD, LVM, SAN, DAS и т. П.
Дэймон,
Кроме того, для RAID 5 и 6 четность распределяется по всем дискам, чтобы выровнять рабочую нагрузку записи / чтения четности, поэтому вы не получите выделенную четность на x число дисков. Что касается количества дисков в безопасном массиве, то здесь нет магического порога. Все дело в игре чисел на основе ваших настроек и того, как вы управляете ими. Если у вас есть только RAID и ничего больше, чем 3-4 диска может быть слишком много, но если у вас есть несколько уровней избыточности и отработки отказа, вы можете безопасно увеличить количество дисков в ваших массивах.
Деймон
3

Процесс восстановления RAID-массива может занять много времени (дней) и очень тяжело работать с дисками. Во время этого перестроения оставшиеся в живых диски более подвержены сбоям из-за их активности.

Перед началом восстановления у оставшихся в живых дисков нет повышенной вероятности отказа.

По этой причине может быть нежелательно иметь «горячий» резерв в системе, поскольку он автоматически вызовет восстановление и вызовет сбой. Кроме того, возникновение неисправимой ошибки чтения во время перестройки может вызвать сбой массива, даже если никакие другие диски не вышли из строя. Лучше сначала скопировать данные из массива, а затем перестроить, если нет недавних резервных копий.

Shaun
источник
1

Краткий ответ ДА ​​- RAID 1 + 0 был разработан ОСОБЕННО из-за вероятности сбоя во время восстановления RAID5.

Длинный ответ - Да, есть повышенная вероятность отказа диска. В «наиболее очевидном / простейшем» случае можно утверждать, что выделяется больше тепла, и, следовательно, вероятность возникновения отказа несколько выше. Тем не менее, это не реальный риск.

Реальный риск заключается в том, что если диски были приобретены примерно в одно и то же время, существует большая вероятность того, что диски выйдут из строя примерно в одно и то же время. Таким образом, вероятность сбоя второго диска при восстановлении увеличивается. К сожалению, этот сценарий не является академическим - чем больше диск, тем дольше перестройка и тем больше вероятность отказа. RAID5 обычно считается малоэффективным при использовании больших дисковых пулов. Принятым решением является рейд 10 (считайте RAID 1 1 + 0). Это в основном создает 2 идентичных набора данных в 2 наборах массивов - таким образом, он использует намного больше (почти вдвое больше) пространства, чем RAID5, но обеспечивает гораздо большую защиту от сбоев с несколькими приводами, что, к сожалению, распространено на дисках большого размера ,

davidgo
источник