Мой вопрос: когда уместно просто создать один большой массив с высокой скоростью чтения и записи, такой как RAID 10, вместо создания меньших массивов для конкретных приложений?
Мне кажется, что если мои общие требования к вводу / выводу не слишком велики, один массив с превосходной производительностью чтения и записи может обеспечить более высокую производительность в целом для всех приложений, за исключением тех случаев (возможно, редких), когда приложения с различными шаблонами доступа достигли своего пика в то же время (копирование большого количества больших файлов, пока база данных захлопывается).
Если я выделю пару шпинделей для конкретной задачи, такой как журналы транзакций, и они даже не потрут с рабочей нагрузкой ... почему бы просто не поместить эту рабочую нагрузку в больший RAID 10? Эти шпиндели смогут вносить свой вклад в другие рабочие нагрузки, вместо того, чтобы сидеть и царапать себя 60% времени.
PS, в моем конкретном случае затраты на RAID 10 не имеют значения, потому что я смотрю на создание нескольких массивов RAID 1 и одного небольшого RAID 5. Переход RAID 10 на необходимое мне пространство было бы сопоставимым.
источник
В последнее время я читал больше статей о том, что RAID 5 - это плохой путь к надежности. Я верю в это больше после того, как диск вышел из строя в массиве RAID 5, заменил диск, и он не смог восстановиться, потому что на втором диске была скрытая неисправимая ошибка чтения, которая вынудила нас переформатировать и восстановить из резервной копии.
По мере того, как диски становятся больше, вероятность того, что на этих огромных дисках будет обнаружена необнаружимая неисправимая ошибка чтения, также возрастает, а с RAID 5 надежность просто больше не уменьшается. Если вы не зеркалируете, очевидно советую использовать RAID 10.
Если вы не делаете что-то, что очень чувствительно к проблемам со скоростью, я бы не беспокоился о том, чтобы разбить вещи на маленькие массивы или что-то в этом роде. Поместите его в RAID 10 и посмотрите, не снижается ли ваша производительность. При правильном кешировании и памяти в системе все должно быть хорошо. Числа для тестов никогда не будут такими, какими вы будете на самом деле, потому что это зависит от вашего фактического использования, фактической загрузки, производительности дисковода, кэширования контроллера, кэширования диска, фрагментации и т. Д.
Лучшее эмпирическое правило - максимально упростить настройку, потому что даже если вы потратите день или неделю на эту настройку в течение года или двух, вам придется устранить некоторые проблемы на этом сервере, которые оставят Вы задаетесь вопросом, почему вы настроили его так, как сделали, если добавили ненужную сложность в конфигурацию.
источник
Насколько предсказуемы вы хотите, чтобы задержки для ваших приложений были?
Например, у вас есть одно приложение, которое действительно чувствительно к задержке, и оно использует файловую систему вместе с вашей финансовой базой данных. При закрытии фискальной системы вы внезапно получаете звонки о времени ожидания приложения, чувствительного к задержке. Как ты собираешься это выяснить?
С другой стороны, я большой поклонник упрощения всего, поэтому я бы проверил, что у вас нет никаких исключительных требований, и консолидировал и упростил ваши конфигурации, если ваши требования не попадают ни в какие странные особые случаи.
источник
Конечно - почему бы и нет. Дело в том, что не забудьте правильно построить свой большой массив из нескольких дисков, ошибиться, и у вас будет долгое время восстановления.
RAID 10 поставляется в двух вариантах:
Как только диск умирает, в одном вам нужно будет просто перестроить один массив raid1. С другой вам придется перестраивать весь массив raid0.
источник