Является ли большой массив RAID-Z таким же плохим, как большой массив RAID-5?

11

В течение долгого времени я слышал о том, насколько плоха идея большого (> 5 ТБ?) Массива RAID-5 просто потому, что существует большой риск отказа другого диска.

Удалось ли RAID-Z1 исправить это для массива любого размера (если вам абсолютно необходимо число, например, 4x2TB или 5x2TB)? Может быть, более безопасный способ повторить данные, которые не так интенсивно на всех дисках?

TheLQ
источник

Ответы:

8

Даже учитывая то, что здесь изложен один из других ответов, а именно, что ZFS работает только с фактически используемыми блоками, а не с пустым пространством, да, все еще опасно делать большой RAIDZ1 vdev. Большинство пулов в итоге используется как минимум на 30-50%, многие доходят до рекомендованного максимума в 80% (некоторые выходят за его пределы, я настоятельно рекомендую не делать этого вообще, по соображениям производительности), так что ZFS работает только с использованными блоками это не огромная победа. Кроме того, некоторые другие ответы заставляют это звучать как плохое чтение, что является причиной проблемы. Это не так. Небольшая гниль внутри блока - это не то, что вас здесь облажает, обычно это другой диск, который просто портится и портится, в то время как резервный диск с первого диска продолжает работать, что убьет вас ... и на дисках объемом 3 ТБ в большом raidz1 это может занять дни, даже недели переместиться на новый диск, так что ваш шанс на это не будет незначительным.

Моя личная рекомендация клиентам - никогда не использовать RAIDZ1 (эквивалент RAID5) вообще с дисками емкостью более 750 ГБ, просто чтобы избежать большого количества потенциальных неприятностей. Я согласен с тем, что они нарушили это правило по другим причинам (у системы есть резервная копия в другом месте, данные не так важны и т. Д.), Но обычно я стараюсь использовать RAIDZ2 как минимальный вариант с большими диски.

Кроме того, по ряду причин я обычно рекомендую использовать не более 8-12 дисков в полосе raidz2 или 11-15 дисков в полосе raidz3. Вы должны быть на нижнем уровне этих диапазонов с дисками объемом 3 ТБ, и, возможно, все будет в порядке на верхнем уровне этих диапазонов на дисках объемом 1 ТБ. То, что это поможет вам избежать мысли о том, что большее количество дисков выйдет из строя во время работы адаптера, является лишь одной из этих причин, но большой.

Если вы ищете какие-то вменяемые эмпирические правила (отредактируйте 04/10/15 - я написал эти правила, имея в виду только вращающиеся диски - потому что они также логичны [зачем вам делать менее 3 дисков в raidz1], они имеет смысл даже для пулов SSD, но когда я записывал их, в моей голове не было ничего общего с пулами SSD:

  • Ни в коем случае не используйте raidz1 на> 750 ГБ дисках.
  • Не используйте менее 3 или более 7 дисков на raidz1.
  • Если вы думаете об использовании 3-дискового raidz1 vdevs, серьезно подумайте о 3-way зеркале vdevs.
  • Не используйте менее 6 или более 12 дисков на raidz2.
  • Не используйте менее 7 или более 15 дисков на raidz3.
  • Всегда помните, что в отличие от традиционных RAID-массивов, где число дисков увеличивает IOPS, в ZFS это число VDEVS, поэтому использование vdevs с более короткой полосой увеличивает потенциал IOPS пула.
NEX7
источник
С изменением размеров диска и производительности, вы все равно порекомендуете такое же правило? (2014)
Лорд Лох.
Любой источник или мотивация для правил большого пальца?
Кенни Эвитт
Источником является опыт меня и коллег в тысячах развертываний ZFS в Nexenta. Что касается обновления - правила стоят (04/10/15), ничего не изменилось, что заставляет меня хотеть редактировать маркеры, хотя я бы сказал, что я написал эти правила без учета SSD. Правила не обязательно одинаковы для твердотельных накопителей, в зависимости от косвенных факторов. С ними у вас есть и другие соображения, такие как узкое место HBA.
Nex7
1
@ Nex7, какова логика для этого в вашей статье блога? «8. RAIDZ - число четных / нечетных дисков: попытайтесь (и не очень сложно) сохранить количество дисков данных в raidz vdev четным числом»
Костин Гуцэ,
Важно помнить случаи использования. Здесь на serverfault мы ориентируемся на профессиональные / бизнес-приложения, поэтому ваш ответ правильный. Тем не менее, для тех, кто занимается установкой клиентов (и, может быть, даже ограниченных бизнес-приложений?), Подумайте, как плохо было бы потерять один блок из одного файла (возможно, пару) из вашего массива, если у вас возникнет ошибка во время сбоя. перестраивать. Ничего страшного? Тогда RAIDZ1 может быть в порядке.
Дэн Притц
11

Является ли RAID-Z таким же плохим, как R5, нет. Это так же хорошо, как R1 или R10, обычно нет.

RAID-Z знает о пустых местах на дисках, где R5 нет. Таким образом, RAID-Z должен только прочитать области с данными, чтобы восстановить отсутствующий диск. Кроме того, данные не обязательно распределяются по всем дискам. Очень маленький файл может находиться только на одном диске с контролем четности на другом диске. Из-за этого RAID-5 придется считывать ровно столько же данных, сколько места, используемого в массиве (если 1 МБ используется для массива 5 ТБ, то для восстановления требуется только 1 МБ).

Иначе говоря, если большая часть большого массива заполнена, то большая часть данных должна быть считана со всех дисков. По сравнению с R1 или R10, где данные должны извлекаться только с одного диска (на каждый неисправный диск; если несколько дисков выходят из строя только в ситуациях, когда массив все еще можно восстановить).

Что вас беспокоит, так это тот факт, что с каждой операцией чтения сектора есть шанс, что вы найдете сектор, который был написан неправильно или больше не читается. Для типичного диска в наши дни это около 1x10 ^ -16 (не все диски равны, поэтому посмотрите спецификации на ваших дисках, чтобы выяснить их рейтинг). Это невероятно редко, но выходит примерно раз в 1PB; для массива 10 ТБ вероятность того, что ваш массив является тостом, составляет 1%, и вы не узнаете его, пока не попытаетесь его восстановить.

ZFS также помогает уменьшить этот шанс, так как большинство нечитаемых секторов заметны, прежде чем вы начнете пытаться перестраивать свой массив. Если вы регулярно чистите массив ZFS, операция очистки обнаружит эти ошибки и обойдет их (или предупредит вас, чтобы вы могли заменить диск, если вы так катитесь). Они рекомендуют вам чистить диски корпоративного уровня примерно от одного до четырех раз в месяц; и потребительские диски по крайней мере один раз в неделю или больше.

Крис С
источник
3

Некоторые из преимуществ RAID-Z по сравнению с традиционным RAID-5 заключаются в том, что он не требует специального оборудования и является более надежным, поскольку позволяет избежать дыры в записи RAID-5.

Тем не менее, и RAID-Z и RAID-5 не выдерживают более одного отказа диска.

Если вы хотите пережить сбой двух дисков с ZFS, вы можете использовать RAIDZ2 , а сбой трех дисков RAIDZ3 .

jlliagre
источник
1
+1 Кроме того, контрольные суммы perblock позволяют ZFS при обнаружении повреждения в массиве выделять затронутые файлы. Большинство адаптеров R5 просто помечают весь том как поврежденный или сообщают ОС, что сектор поврежден, в любом случае HBA не может определить, какой диск неправильный в сценарии повреждения.
Крис С
Более подробное обсуждение по обработке сбоев ZFS»переноса актуальных данных: ZFS бесконечных актуальных данных
на CVN