Как часто мне следует чистить мой RAID?

13

В общем, я хотел бы знать, как часто нужно очищать RAID-массив. Что способствует более частой очистке (чтение данных? Запись данных? Неожиданное отключение? Возраст диска? Размер диска? Количество пользователей? И т. Д.)?

Я читал вики Arch здесь, и все, что он действительно говорит, это то, что чистка должна выполняться регулярно. Мне просто интересно, насколько регулярно это достаточно. Очевидно, это будет зависеть, но каков разумный диапазон? Ежегодно? Ежемесячно? Еженедельно? Ежедневно? Большое спасибо за любую информацию.

mrfred
источник
1
Насколько велик ваш массив? Сколько времени занимает очистка вашего массива? Большие массивы могут занять часы или дни для полной очистки. Очевидно, что вы не можете чистить чаще, чем нужно, чтобы завершить одну чистку. Пакет Debian включает в себя скрипт cron, который запускается в первое воскресенье каждого месяца.
Зоредаче
Я зависит, насколько это грязно :)
metacom
@Zoredache: Это именно то, что я искал. Так как большие массивы занимают больше времени, это уменьшит частоту, которую вы должны чистить? Увеличит ли количество пользователей эту частоту? Вам нужно почистить, если вы не пишете много новых данных?
mrfred
Программный RAID? Аппаратный RAID? ZFS?
14:00

Ответы:

15

Как часто вы должны сканировать, зависит от многих вещей.

  • Возраст дисков. Чем они старше, тем больше вероятность, что они будут содержать зло .
  • Оригинальное качество дисков под вопросом. Материал, продаваемый как «предприятие», скорее всего, будет работать без ошибок, а диски 2014 года размером 1 + ТБ намного надежнее, чем их эквиваленты 2009 года, когда они поставлялись.
  • Насколько чувствителен ваш производственный ввод / вывод к чистящему вводу / выводу.
  • Какую часть вашего набора данных вы считаете своим рабочим набором.

По этой причине поставщики аппаратного RAID часто включают фоновый процесс очистки, некоторые даже позволяют вам настроить приоритет ввода / вывода процесса очистки, что позволяет избежать (или значительно уменьшить) производственные потери ввода / вывода для очистки. Конечно, если у вас низкий приоритет, и ваш ввод-вывод при работе с дисками в основном работает ровно, вы, вероятно, никогда не завершите очистку и даже не заметите ее, пока не получите ошибку.

К сожалению, я не знаю, удаляет ли ядро ​​Linux процесс очистки ввода-вывода или нет. В любом случае, это хорошая идея, чтобы проверить это с нагрузками вашего продукта, чтобы убедиться, что любые потери производительности приемлемы. Если это приемлемо, хорошо! Если это не так, вы можете выбрать, добавлять ли шпиндели или нет, чтобы разрешить ввод-вывод scrub + prod или просто принять риск возможных сбоев массива в будущем.

Еще одна вещь, которая влияет на частоту очистки, это схема использования ввода / вывода. Если производственные нагрузки затрагивают только меньшинство дисков, единственным вводом / выводом, который обычно обнаруживает неисправный блок в незанятой части, будет ваш скраб; в этом случае вы хотите почистить чаще. Если ваши производственные нагрузки регулярно читают весь набор дисков (например, ежедневные полные резервные копии), то производственный ввод-вывод быстрее столкнется с проблемами, и вы сможете выполнять очистку реже.

Хороший план действий будет:

  1. Запустите несколько тестов, чтобы увидеть, будет ли очистка мешать производству.
    1. Выясните, сколько времени занимает полный скраб, пока вы на нем.
  2. Выясните, какой процент вашего дискового набора будет получать несколько обращений в течение данной недели (включите резервный ввод-вывод, если таковой имеется, в этот расчет).
  3. На основании 1 и 2 решите, будете ли вы в реже или чаще в лагере.

Как только у вас есть эти данные ...

  • Если полное сканирование занимает менее суток и не оказывает заметного влияния на производство, вы можете ходить так часто, как раз в неделю.
  • Если полное сканирование занимает менее суток и влияет на производительность, определите, какая часть вашей недели / месяца меньше всего затронуто, и попробуйте запустить его тогда.
  • Если полное сканирование занимает более одного дня, но меньше недели и не влияет на производительность, запускайте его так же часто, как раз в две недели или раз в два месяца.
  • Если полное сканирование занимает более одного дня, но меньше недели и влияет на производительность, рассмотрите возможность добавления ресурсов для его запуска, выполнения сканирования во время организованных периодов обслуживания или использования возможности очистки в режиме ожидания / проверки. это подходит и начинается непрерывно.
  • Если полное сканирование занимает более недели, часто достаточно одного раза в месяц. Но если это влияет на производство, вам нужно будет добавить ресурсы для его завершения.
sysadmin1138
источник