Почему нераспределенный накопитель Hitachi HDS5C3020 начинает потреблять на 50% больше энергии через 15 минут после загрузки?

19

В системе Debian 6.0.6 есть 74 диска по 2 ТБ Toshiba DT01ABA200. Эти накопители идентифицируются как накопители Hitachi HDS5C3020BLE630, на которых установлена ​​версия микропрограммы MZ4OAAB0. 64 накопителя, подключенных с помощью карт расширения HP SAS к контроллеру LAS 2008 SAS, еще 5 накопителей подключены непосредственно к материнской плате, 4 накопителя подключены к PCI-контроллеру на основе Sil, а последний 1 накопитель питается только без кабеля для передачи данных. Встроенные BIOS контроллера LSI и карты Sil отключены, а модули mpt2sas и sata_sil удалены из Linux debian 2.6.32-5-amd64 # 1 SMP Sun 23 сентября 10:07:46 UTC 2012 x86_64 ядро ​​GNU / Linux. Модуль mpt2sas загружается после загрузки с помощью команды modprobe в /etc/rc.local. Эти 74 диска не разбиты на разделы, не отформатированы и не смонтированы.

Система потребляет:

  • с 0 приводами : 70,6 - 70,9 Вт (также через 15 минут после загрузки);
  • с 74 дисками : 330 - 360 Вт, сразу после загрузки (эквивалентно 3,5 - 3,9 Вт на диск в режиме ожидания);
  • с 74 приводами : 420 - 466 Вт, каждый раз на 15-й минуте безотказной работы (что эквивалентно 4,7 - 5,3 Вт на привод в режиме ожидания).

В спецификации привода указано 4,7 Вт для чтения / записи и 3,3 Вт для энергопотребления в режиме ожидания.

Повышенное энергопотребление наиболее вероятно в линии 5 В, потому что примерно через 1 минуту «защита от перегрузки по току» (OCP) источника питания (PSU) отключает питание. Используемый блок питания представляет собой модель с одной шиной с OCP> 122 А на линии 12 В и> 55 А на линии 5 В.

Регресс:

  • Не имеет значения, установлено ли для привода значение APM отключено или 1 (максимальное энергосбережение).
  • Операционная система не записывает операции чтения / записи в /proc/diskstats. Значения там идентичны (28 операций чтения, 0 операций записи), как сразу после операции modprobe.
  • Невозможно проверить, что происходит при загрузке на системную плату, это BIOS, чтобы исключить любое вмешательство ОС, потому что системная плата Super Micro X8SI6-F с микропрограммой 06/27/12 имеет ошибку, которая неправильно считывает температуру датчика процессора +74.0 C как " Высокий уровень »в режиме BIOS и отключение питания через 1 минуту.

Что может быть причиной чтения / записи диска на всех дисках на 15-й минуте после загрузки и как предотвратить это?

Pro Backup
источник
Просто любопытно ... Что это за система? Резервная система? Весь программный RAID?
Ewwhite
На данный момент просто тестирование, предназначенное для резервного копирования без какого-либо RAID. Резервирование будет обеспечиваться дополнительными вторичными и третичными серверами.
Pro Backup
@ewwhite напоминает мне о стручках Backblaze. Кто-то должен был упомянуть это имя.
Дмитрий Чубаров
@Dmitri Chubarov Это похоже на модуль хранения Backblaze, но без множителей портов SATA, высотой 5U, без RAID, 74 вместо 45 дисков, одного блока питания, только 2,0 Вт потребляемой мощности для охлаждения и когда все диски бездействуют, имея Разница температур в 6 градусов градусов между самым крутым и самым теплым приводом.
Pro Backup

Ответы:

20

Похоже, что диски выполняют SMART-очистку (автоматическое автономное тестирование).

smartctl -a /dev/hdx

следует подтвердить конфигурацию с помощью:

Auto Offline Data Collection: Enabled.

Отключить с помощью:

smartctl --offlineauto=off /dev/hdx

Это может быть что-то еще тоже ...

Крис С
источник
smartctl --offlineauto=offсделал свое дело. По крайней мере, в течение 32 минут больше не происходит значительного увеличения энергопотребления, приводящего к отключению OCP блока питания. В качестве бонуса hdparm -SX теперь переводит диски из «активного / холостого хода» в «резервный». Однако диски, подключенные к контроллеру sata_sil, не могут быть контроллером. Временное подключение этих дисков к другому контроллеру - это обходной путь. Параметр сбора данных в автономном режиме сохраняется после перезагрузок и циклов питания.
Pro Backup