Управление циклами повторного изучения батареи на LSI и аналогичных RAID-контроллерах

12

Как инженеры справляются с циклами переучивания батареи RAID-контроллера?

Как отмечено в: Что такое «повторное изучение батареи» на LSI MegaRaid? , цикл повторного изучения разряжает батарею контроллера RAID (BBWC или BBU), тем самым устраняя ускорение кэша записи. Срок службы батареи проверяется и после зарядки кэш записи снова включается. Это оказывает очевидное влияние на производительность ввода-вывода сервера в течение цикла повторного изучения. Я думаю, что это происходит ежемесячно.

Отмечено снижение производительности, особенно в системах баз данных:

Медленная база данных? Проверьте батарею RAID!

Переучите о своей батарее

Мой опыт связан с серверами HP ProLiant, чьи контроллеры Smart Array не проходят это упражнение ( или, по крайней мере, имеют более активный мониторинг времени автономной работы ). Это кажется ужасной функцией ( максимальное неудобство, небольшой выигрыш ), но я нахожусь в среде со многими контроллерами LSI (на оборудовании Supermicro ) и хотел бы посмотреть, можно ли применить общую политику к соответствующим системам.

  • Каково расписание по умолчанию цикла повторного изучения на контроллере LSI?
  • Эти циклы переучивания полезны?
  • Должна ли эта функция быть отключена?
  • Если вы решите оставить эту функцию включенной в своей среде, как вы будете управлять планированием? Планируете ли вы это вручную или разрешаете контроллеру устанавливать собственное расписание?
  • Одинаково ли влияют контроллеры Dell Perc ? ( LSI является OEM )
ewwhite
источник
Я не могу говорить с остальной частью вопроса, но PERCs действительно переучиваются.
MDMarra
Предполагается, что более новые контроллеры LSI имеют опцию «прозрачного переучивания». На практике (на оборудовании класса Dell C) я не видел эту работу.
toppledwagon

Ответы:

13

Совсем недавно я прочитал статью одного из инженеров Годадди на эту тему: « Учиться справляться с обучением»

На их оборудовании (картах Dell PERC) цикл обучения батареи происходит каждые 90 дней, но нет способа узнать, когда именно это произойдет, то есть в часы пик или в непиковое время.

Они говорили о разных решениях:

  • Прямое отключение Battery Learning. Проблема с этой опцией заключается в том, что вы не будете знать о состоянии вашей батареи, а также о том, как долго и сколько она может удерживать заряд, поэтому в случае сбоя вы рискуете потерять данные.

  • Используйте другое оборудование. Некоторые контроллеры имеют 2 батареи и переключаются между ними во время таких циклов обучения. Кроме того, существуют RAID-контроллеры (такие как Dell H710), которым не нужны батареи, а вместо этого используется энергонезависимая NVRAM для хранения незафиксированных данных.

  • Принудительная обратная запись (кэширование) независимо от состояния ваших батарей. Как и первое решение, вы рискуете потерять данные.

В конечном счете, они устанавливают кроны на непиковые часы, которые следят за следующим циклом обучения, и, если это происходит в течение следующих 24 часов, они заставляют это произойти немедленно. Таким образом, они сохраняют выгоду от работы с батареями, но не работают в часы максимальной нагрузки.

Mxx
источник