Один большой RAID 10 против нескольких меньших массивов?

10

Мой вопрос: когда уместно просто создать один большой массив с высокой скоростью чтения и записи, такой как RAID 10, вместо создания меньших массивов для конкретных приложений?

Мне кажется, что если мои общие требования к вводу / выводу не слишком велики, один массив с превосходной производительностью чтения и записи может обеспечить более высокую производительность в целом для всех приложений, за исключением тех случаев (возможно, редких), когда приложения с различными шаблонами доступа достигли своего пика в то же время (копирование большого количества больших файлов, пока база данных захлопывается).

Если я выделю пару шпинделей для конкретной задачи, такой как журналы транзакций, и они даже не потрут с рабочей нагрузкой ... почему бы просто не поместить эту рабочую нагрузку в больший RAID 10? Эти шпиндели смогут вносить свой вклад в другие рабочие нагрузки, вместо того, чтобы сидеть и царапать себя 60% времени.

PS, в моем конкретном случае затраты на RAID 10 не имеют значения, потому что я смотрю на создание нескольких массивов RAID 1 и одного небольшого RAID 5. Переход RAID 10 на необходимое мне пространство было бы сопоставимым.

Boden
источник

Ответы:

10

Знание того, как настроить хранилище, - это все, что касается измерения и бюджетирования IOPS и пропускной способности. (Здесь я упрощен, потому что размер процентного сочетания операций чтения / записи, среднего количества операций ввода-вывода, размера полосы RAID и процента попаданий в кэш очень важен. Если вы сможете получить эти цифры, вы сможете сделать свои расчеты еще более точными.)

Там действительно хороший маленький IO калькулятор здесь что я часто использую при планировании из хранилища. Каталог хранения wmarow также хорош для получения довольно современных показателей производительности диска.

Если я выделю пару шпинделей для конкретной задачи, такой как журналы транзакций, и они даже не потрут с рабочей нагрузкой ... почему бы просто не поместить эту рабочую нагрузку в больший RAID 10?

Помните, что установка последовательного ввода-вывода на шпиндель со случайным вводом-выводом делает этот последовательный ввод-вывод случайным. Ваши диски журнала транзакций могут выглядеть так, как будто они не потеют, потому что вы видите последовательные операции ввода-вывода. Последовательное чтение и запись на том RAID-1 будет достаточно быстрым, поэтому, если вы, например, «не разбиваетесь» на длину очереди диска, вы не получите всю историю.

Измерьте или вычислите максимально возможный случайный IOPS для предполагаемого целевого тома, возьмите базовую линию текущей рабочей нагрузки на этом томе и затем решите, достаточно ли у вас запаса для помещения этих операций ввода-вывода в журнал транзакций в оставшийся случайный IO в целевом томе. Кроме того, не забудьте выделить место, необходимое для рабочей нагрузки (очевидно). Если вы так склонны, добавьте процент дополнительного «запаса» в распределении рабочей нагрузки / пространства ввода-вывода.

Продолжайте использовать эту методологию для всех других рабочих нагрузок, которые вы хотите поместить в целевой том RAID-10. Если у вас закончился случайный IOPS, то вы слишком много копите в том - добавьте больше дисков или перенесите часть рабочей нагрузки на выделенные тома. Если вам не хватает места, добавьте больше дисков.

Эван Андерсон
источник
Одна из проблем заключается в том, что с моей текущей конфигурацией я действительно могу получить только хорошее измерение общего IOPS, которое составляет всего около 300 (чтение 60%) со средним значением 14 Кбайт на передачу. Большой массив RAID 10, который я рассматриваю, должен быть в состоянии выполнить 758 случайных 16 000 операций ввода-вывода в секунду (60% с учетом кэша). Однако этот расчет не учитывает смешанные рабочие нагрузки, и именно с этим я борюсь.
Боден
4

В последнее время я читал больше статей о том, что RAID 5 - это плохой путь к надежности. Я верю в это больше после того, как диск вышел из строя в массиве RAID 5, заменил диск, и он не смог восстановиться, потому что на втором диске была скрытая неисправимая ошибка чтения, которая вынудила нас переформатировать и восстановить из резервной копии.

По мере того, как диски становятся больше, вероятность того, что на этих огромных дисках будет обнаружена необнаружимая неисправимая ошибка чтения, также возрастает, а с RAID 5 надежность просто больше не уменьшается. Если вы не зеркалируете, очевидно советую использовать RAID 10.

Если вы не делаете что-то, что очень чувствительно к проблемам со скоростью, я бы не беспокоился о том, чтобы разбить вещи на маленькие массивы или что-то в этом роде. Поместите его в RAID 10 и посмотрите, не снижается ли ваша производительность. При правильном кешировании и памяти в системе все должно быть хорошо. Числа для тестов никогда не будут такими, какими вы будете на самом деле, потому что это зависит от вашего фактического использования, фактической загрузки, производительности дисковода, кэширования контроллера, кэширования диска, фрагментации и т. Д.

Лучшее эмпирическое правило - максимально упростить настройку, потому что даже если вы потратите день или неделю на эту настройку в течение года или двух, вам придется устранить некоторые проблемы на этом сервере, которые оставят Вы задаетесь вопросом, почему вы настроили его так, как сделали, если добавили ненужную сложность в конфигурацию.

Барт Сильверстрим
источник
1
Да, я перешел с RAID 5 на RAID 6, и штраф за запись убивает меня. Мне нравится идея одного большого RAID 10. Что я могу использовать для измерения различных типов одновременной нагрузки ввода / вывода?
Боден
1
Секундомер самый точный :-)
Барт Сильверстрим
1
Не стоит недооценивать важность дисков и контроллеров. У нас есть Dell NAS с RAID 5, и он задыхается, когда пользователи входят в систему и извлекают из него профили, и мы пришли к выводу, что причина в том, что диски не имеют скорости вращения 10 000 об / мин, после небольшого исследования показателей производительности. В итоге мы переместили определенные данные на отдельный сервер, чтобы снять часть рабочей нагрузки.
Барт Сильверстрим
2
Честно говоря, я не понимаю, почему кто-то будет использовать RAID 5 в корпоративной среде. Мы RAID 10 полностью.
Звуковой сигнал
2
Потому что в то время RAID 5 не был злом :-) RAID 10 считался роскошью ненужной на нашем уровне бизнеса, я полагаю, вы могли бы сказать. Цены действительно упали, времена изменились, и мы все еще поддерживаем то, что «работает» в серверной комнате.
Барт Сильверстрим
2

Насколько предсказуемы вы хотите, чтобы задержки для ваших приложений были?

Например, у вас есть одно приложение, которое действительно чувствительно к задержке, и оно использует файловую систему вместе с вашей финансовой базой данных. При закрытии фискальной системы вы внезапно получаете звонки о времени ожидания приложения, чувствительного к задержке. Как ты собираешься это выяснить?

С другой стороны, я большой поклонник упрощения всего, поэтому я бы проверил, что у вас нет никаких исключительных требований, и консолидировал и упростил ваши конфигурации, если ваши требования не попадают ни в какие странные особые случаи.

Крис
источник
0

Конечно - почему бы и нет. Дело в том, что не забудьте правильно построить свой большой массив из нескольких дисков, ошибиться, и у вас будет долгое время восстановления.

RAID 10 поставляется в двух вариантах:

  • RAID 1 + 0, где вы строите 2 массива RAID 1, а затем разделяете их.
  • RAID 0 + 1, где вы строите 2 массива RAID 0, а затем отражаете их.

Как только диск умирает, в одном вам нужно будет просто перестроить один массив raid1. С другой вам придется перестраивать весь массив raid0.

gbjbaanb
источник