HP SmartArray P400: как восстановить неисправный логический диск?

8

У меня есть сервер HP с контроллером SmartArray P400 (включая 256 МБ кэш-памяти / резервной батареи) с логическим диском с замененным неисправным физическим диском, который не восстанавливается.

Вот как это выглядело, когда я обнаружил ошибку:

~ # / usr / sbin / hpacucli ctrl slot = 0 показать конфигурацию
Smart Array P400 в слоте 0 (встроенный) (sn: XXXX)

  массив A (SATA, неиспользуемое пространство: 0 МБ)
    логический привод 1 (698,6 ГБ, RAID 1, ОК)
      физический привод 1I: 1: 1 (порт 1I: блок 1: отсек 1, SATA, 750 ГБ, ОК)
      физический привод 1I: 1: 2 (порт 1I: блок 1: отсек 2, SATA, 750 ГБ, ОК)

  массив B (SATA, неиспользуемое пространство: 0 МБ)
    логический привод 2 (2,7 ТБ, RAID 5, сбой)
      физический привод 1I: 1: 3 (порт 1I: блок 1: отсек 3, SATA, 750 ГБ, ОК)
      физический привод 1I: 1: 4 (порт 1I: блок 1: отсек 4, SATA, 750 ГБ, ОК)
      физический привод 2I: 1: 5 (порт 2I: блок 1: отсек 5, SATA, 750 ГБ, ОК)
      физический привод 2I: 1: 6 (порт 2I: блок 1: отсек 6, SATA, 750 ГБ, сбой)
      физический привод 2I: 1: 7 (порт 2I: блок 1: отсек 7, SATA, 750 ГБ, ОК)

  Unassigned
      физический привод 2I: 1: 8 (порт 2I: блок 1: отсек 8, SATA, 750 ГБ, ОК)
~ # 

Я думал, что у меня есть диск 2I: 1: 8, настроенный как запасной для массива A и Array B, но, похоже, это не тот случай :-(. Я заметил проблему из-за ошибок ввода-вывода на хосте, даже если только 1 физический привод RAID5 вышел из строя.

Кто-то знает, почему это могло произойти? Логический привод должен перейти в режим «Degraded», но при этом быть полностью доступным с хоста os !?

Сначала я попытался добавить неназначенный диск 2I: 1: 8 в качестве запасного для логического привода 2, но это оказалось невозможным:

~ # / usr / sbin / hpacucli ctrl slot = 0 массив B добавить запчасти = 2I: 1: 8
    Ошибка: эта операция не поддерживается в текущей конфигурации.
    Используйте команду «show» на устройствах, чтобы показать дополнительную информацию 
    по поводу конфигурации.
~ #  

Интересно, что можно добавить неназначенный диск в первый массив без проблем. Я подумал, что, возможно, контроллер переводит массив в состояние «сбой» из-за отсутствия запасного и защищает сбойные массивы от модификации. Поэтому я попытался снова включить логический привод (чтобы потом добавить запасной):

~ # / usr / sbin / hpacucli ctrl slot = 0 ld 2 изменить повторно
    Предупреждение: любые ранее существующие данные на логическом диске могут не 
    быть действительным или восстанавливаемым. Продолжить? (да / нет) у

    Ошибка: эта операция не поддерживается в текущей конфигурации.
    Используйте команду «show» на устройствах, чтобы показать дополнительную информацию
    по поводу конфигурации.
~ # 

Но, как видите, возобновить логический привод это было невозможно.

Теперь я заменил неисправный диск, добавив его неназначенным диском. Статус теперь выглядит так:

~ # / usr / sbin / hpacucli ctrl slot = 0 показать конфигурацию
Smart Array P400 в слоте 0 (встроенный) (sn: XXXX)

  массив A (SATA, неиспользуемое пространство: 0 МБ)
    логический привод 1 (698,6 ГБ, RAID 1, ОК)
      физический привод 1I: 1: 1 (порт 1I: блок 1: отсек 1, SATA, 750 ГБ, ОК)
      физический привод 1I: 1: 2 (порт 1I: блок 1: отсек 2, SATA, 750 ГБ, ОК)

  массив B (SATA, неиспользуемое пространство: 0 МБ)
    логический привод 2 (2,7 ТБ, RAID 5, сбой)
      физический привод 1I: 1: 3 (порт 1I: блок 1: отсек 3, SATA, 750 ГБ, ОК)
      физический привод 1I: 1: 4 (порт 1I: блок 1: отсек 4, SATA, 750 ГБ, ОК)
      физический привод 2I: 1: 5 (порт 2I: блок 1: отсек 5, SATA, 750 ГБ, ОК)
      физический привод 2I: 1: 6 (порт 2I: блок 1: отсек 6, SATA, 750 ГБ, ОК)
      физический привод 2I: 1: 7 (порт 2I: блок 1: отсек 7, SATA, 750 ГБ, ОК)
~ # 

Логический диск все еще не доступен. Почему это не восстановление?

Что я могу сделать?

К вашему сведению, это конфигурация моего контроллера:

~ # / usr / sbin / hpacucli ctrl slot = 0 показать
 Smart Array P400 в слоте 0 (встроенный)
  Интерфейс шины: PCI
  Слот: 0
  Серийный номер: XXXX
  Серийный номер кеша: XXXX
  Состояние RAID 6 (ADG): включено
  Состояние контроллера: ОК
  Слот шасси:
  Версия аппаратного обеспечения: Rev E
  Версия прошивки: 5.22
  Приоритет перестроения: средний
  Расширить приоритет: средний
  Задержка сканирования поверхности: 15 секунд
  Уведомление о несоответствии анализа поверхности: отключено
  Буферизация записи Raid1: отключена
  Тайм-аут после сообщения: 0 секунд
  Подарок кеша: есть
  Состояние кэша: ОК
  Коэффициент ускорения: 25% чтения / 75% записи
  Кэш записи диска: отключен
  Общий размер кэша: 256 МБ
  Кэш записи без батареи: отключен
  Резервный источник питания кэша: батареи
  Количество батарей / конденсаторов: 1
  Состояние батареи / конденсатора: ОК
  SATA NCQ Поддерживается: True
~ # 

Спасибо за помощь заранее.

TegtmeierDE
источник

Ответы:

5

Ответ не приятный. Существует высокая вероятность того, что ваш массив находится в состоянии «ожидания восстановления», когда в наборе массивов RAID5 есть еще один неисправный диск, который препятствует завершению восстановления. Вот почему вы должны избегать RAID5 в эти дни . Не помогает, что это диски SATA ... Вероятность проблем еще выше. Попробуйте выключить систему (дать дискам вращаться) и снова включить питание. Следуйте инструкциям на экране массива BIOS и выберите F2параметр «включить все логические диски». Это может запустить процесс перестройки.

В противном случае это восстановление / восстановление с новыми дисками.

ewwhite
источник
0

Вы должны загрузиться в ACU и посмотреть, что именно происходит. если весь логический диск недоступен, вы можете включить его там.

Кли
источник