У контроллеров RAID обычно возникают проблемы совместимости с дисками SATA?

22

Мы боролись с RAID-контроллером в нашем сервере баз данных, Lenovo ThinkServer RD120. Это переименованный Adaptec, который Lenovo / IBM называет ServeRAID 8k .

Мы исправили этот ServeRAID 8k до самого последнего и лучшего:

  • Версия RAID BIOS
  • Версия BIOS объединительной платы RAID
  • Драйвер Windows Server 2008

Этот RAID-контроллер имел несколько критических обновлений BIOS даже в течение короткого 4-месячного периода времени, которым мы его владели, и история изменений просто ... ну, страшно.

Мы попробовали стратегии обратной записи и сквозной записи на логических дисках RAID. Мы по-прежнему получаем периодические ошибки ввода-вывода при высокой активности диска. Они не распространены, но серьезны, когда они случаются, так как они вызывают тайм-ауты ввода-вывода SQL Server 2008 и иногда сбой пулов соединений SQL.

Мы были в конце нашей веревки, устраняющей эту проблему. Если не считать хардкорных вещей, таких как замена всего сервера или замена оборудования RAID, мы впали в отчаяние.

Когда я впервые получил сервер, у меня была проблема, когда отсек для дисков № 6 не был распознан. Переключение жестких дисков на другие марки, как ни странно, это исправило - и обновление RAID BIOS (впервые за много раз) исправило его навсегда, так что я смог использовать оригинальный «несовместимый» диск в отсеке 6. На догадываясь, я начал предполагать, что выбранные жесткие диски Western Digital SATA были как-то несовместимы с контроллером ServeRAID 8k.

Покупка 6 новых жестких дисков была одним из самых дешевых вариантов на столе, поэтому я выбрал 6 жестких дисков Hitachi (также известный как Lenovo, или Lenovo), полагая, что RAID-контроллер IBM / Lenovo с большей вероятностью будет работать с дисками, которыми он обычно является. продается с.

Похоже, эта догадка окупилась - мы пережили три наших самых тяжелых дня загрузки (понедельник, вторник, среда) без единой ошибки ввода-вывода. До этого у нас регулярно было хотя бы одно «событие» ввода / вывода в этот период времени. Похоже, что переключение марок жестких дисков устранило наши неустойчивые проблемы ввода-вывода RAID!

Хотя я понимаю, что IBM / Lenovo, вероятно, тестируют свои RAID-контроллеры исключительно на жестких дисках своей собственной марки, я обеспокоен тем, что у RAID-контроллера возникают такие тонкие проблемы ввода-вывода с жесткими дисками определенных марок.

Итак, мой вопрос, является ли такого рода несовместимость дисков SATA распространенной с контроллерами RAID? Существуют ли диски некоторых марок, которые работают лучше других или «проверены» на конкретном RAID-контроллере? Я предположил, что все стандартные жесткие диски SATA одинаковы и будут достаточно хорошо работать на любом RAID-контроллере (достаточного качества).

Джефф Этвуд
источник

Ответы:

6

Да , я сталкивался с этим с младшими картами и глючными драйверами. Тем не менее, нет , не на современной карточке Adaptec ребрендинг. Вау это все, что я могу сказать. Одна вещь, чтобы рассмотреть, возможно, это больше ошибка с дисководом, чем контроллер RAID.

У меня нет хорошего ответа, но, поскольку вы, кажется, исчерпали большинство своих возможностей, кроме замены карты (и замены дисков, у вас получилось), вот несколько идей, которые вы можете рассмотреть для устранения неполадок:

  • Диски WD были дисками RE (RAID Edition), верно? Восстановление после ошибки ограничено по времени, поэтому, если у вас его нет и диск пытается восстановить сектор, вы получите долгую паузу с этого диска. Если RAID-контроллер терпелив и не роняет диск, у вас будут большие проблемы.

  • Проверьте данные SMART на удаленных дисках и посмотрите, есть ли что-нибудь интересное.

Еще один комментарий о важности функции временного восстановления после ошибок (TLER) от поддержки поставщика NAS / RAID:

Как я уже упоминал ранее, мы всегда предлагаем клиентам использовать диски уровня предприятия, если они используют диски в настройках RAID. Диски корпоративного уровня имеют более согласованное время отклика, поэтому RAID будет безопаснее.

TorgoGuy
источник
Не знаю, но у них действительно было «исправление ошибок с ограничением по времени для конкретного RAID», как показано на вкладке спецификации здесь. newegg.com/Product/Product.aspx?Item=N82E16822136143
Джефф Этвуд,
Да, вы получили правильные. (Обратите внимание на RE2, указанный в названии.) Это разрушает эту теорию! Конечно, я все равно проверил бы данные SMART на всякий случай (да, я знаю, что они редко полезны) ...
TorgoGuy
оказывается, диски были в некотором роде в конце концов. Брент Озар унаследовал наши старые диски и был в RMA хотя бы один из них из-за странностей ..
Джефф Этвуд
также интересное связанное обсуждение функции TLER, которую некоторые производители видят как специальный программный бит, который они переворачивают, чтобы сделать накопители волшебно «корпоративными» .. fatwallet.com/forums/expired-deals/993547
Джефф Этвуд,
13

Даже для обычных настольных жестких дисков, не являющихся RAID-массивами, покупка дисков у поставщика (с ожидаемой нелепой наценкой) часто может иметь значение. Например, Apple старается поставлять только те диски, которые действительно способны поддерживать флаг Mac OS XF_FULLSYNC fcntl() , что очень важно для обеспечения надежной работы таких вещей, как резервные копии Time Machine .

Опять же, это простое использование ванильного рабочего стола без использования RAID. Что-нибудь более сложное, чем это, и вы определенно хотите купить, если не собственные переоцененные диски производителя, то по крайней мере те модели дисков, которые вы точно знаете, находятся в «одобренном» списке поставщика.

Итак, чтобы ответить на ваш вопрос, это распространено? Я бы сказал, да, чаще, чем вы думаете, даже за пределами корпоративной сферы.

Джон Сиракуза
источник
Я бы определил, какие модели накопителей обычно продает продавец, если вы собираетесь выполнить модернизацию накопителей своими силами, чтобы снизить затраты. Я бы также порекомендовал не покупать диски (или контроллеры), с которыми система только начала поставляться, чтобы не оказаться тем, кто обнаружит ошибки! По некоторым причинам SATA кажется более ненадежным, чем SAS в этом отношении ...
Кристофер Эдвардс
4

Я не думаю, что это обычное явление. Однако, как только вы начнете использовать корпоративные контроллеры хранилища, будь то SAN или автономные RAID-контроллеры, вы, как правило, захотите придерживаться их списка совместимости довольно близко.

Возможно, вам удастся сэкономить несколько долларов на наклейке, купив дешевый ассортимент дисков, но это, вероятно, одна из последних областей, на которых я хотел бы сэкономить, учитывая важность данных в большинстве сценариев.

Другими словами, явная несовместимость очень редка, но рекомендуется строго соблюдать совместимость.

Марк С. Расмуссен
источник
4

Я бы не мечтал об использовании дисков SATA для сервера - ни у одного из них нет ожидаемого рабочего цикла диска с качеством сервера, и у них нет такого набора команд, который есть у SCSI / SAS для мониторинга производительности и работоспособности диска. Серверы Lenovo дешевы и хороши, если у вас много серверов, но ни один из них не настолько важен, но есть причина, по которой серверы HP серии 300 составляют 40% рынка - они работают. В частности, их контроллеры дисков «SmartArray» не имеют себе равных по надежности и производительности, и их гарантия перед отказом является долгожданным дополнением. Не самый дешевый, но сколько стоит ваше время? Я уже двадцать лет покупаю их (хорошо Compaq first tbh) серверы, и у меня нет никаких проблем с покупкой 500-800 новых серверов в год, которые я делаю. Серьезно проверь их.

Chopper3
источник
2

Ответ, как всегда, «это зависит».

Для определенного корпоративного хранилища (скажем, EMC) поставщик будет специально подходить для накопителей и даже пойдет на загрузку пользовательских прошивок.

Как говорит Марк, я считаю, что это будет лучшим, если вы будете следовать утвержденному списку поставщика, если он есть. Начальная экономия перевешивается временем, потраченным на поиски гремлинов.

Джодер Хо
источник
правда, но Lenovo «специальные» диски Hitachi SATA стоят 250 долларов, и я могу купить такой же диск Hitachi за 60 долларов. Это разница почти в 5 раз, другими словами .. 1250 долларов против 300 долларов. Я готов сделать некоторые эксперименты для великого ..
Джефф Этвуд
Я знаю, что разметка иногда нелепа, вы должны увидеть цены на диски EMC! Но это сводится к тому, насколько вы цените свои данные. Наличие надежного хранилища стоит $$$. Дон Макаскилл из Smugmug был в восторге от Sun 7410, и это может быть то, что вы хотите проверить.
Джодер Хо,
Интересно, есть ли поддерживаемая 3ware карта? У меня был хороший опыт с ними за эти годы.
Джодер Хо,
2

У вас есть контроллер SAS, это может быть проблемой. Хотя протокол SAS можно использовать для туннелирования команд ATA, сигнализация на физическом уровне немного отличается (SAS использует более высокое напряжение и более широкий дифференциал). Почти все контроллеры могут напрямую подключаться к дискам SATA, но если в середине (большая «дрянная») задняя панель, сигнал может быть прерван. Обычно в корпоративном мире подключение драйверов SATA непосредственно к контроллеру SAS официально не поддерживается, следует использовать промежуточный блок (небольшая логическая плата, которая подключается непосредственно к диску, который с одной стороны понимает полный протокол SAS, а с другой говорит ATA - таким образом объединительная плата несет более высокую сигнализацию SAS).

Несколько связано: смешение дисков SAS и SATA на одной объединительной плате имеет тенденцию давать сбой, поскольку сигнализация всех дисков (включая SAS) снижается до уровня SATA.

Лука Теттаманти
источник
1

Скорее всего, ваши накопители WD нуждаются в обновлении прошивки . Смотрите эту заметку IBM для загрузки и применения обновления. Как видно из инструкции , накопители WD далеко не единственные, у которых проблемы.

Если вы собираетесь поместить свои диски в среду сервера налогообложения, вы столкнетесь с большим количеством проблем, чем в типичной конфигурации рабочего стола для энтузиастов.

Не могли бы вы прокомментировать, почему вы решили использовать диски серии Deskstar для настольных компьютеров вместо серии Ultrastar для корпоративных / RAID-классов ? Считаете ли вы, что дополнительные расходы не стоят дополнительной надежности и скорости?

Питер Стуер
источник
Когда дело доходит до жестких дисков, я верю во многие из них - дешевые и легко заменяемые массивы, где производительность зависит от масштаба.
Джефф Этвуд
Будьте осторожны при использовании настольных накопителей с контроллерами хранилищ корпоративного уровня. Диски корпоративного уровня (обычно) поддерживают команды и запросы, которые не поддерживаются дисками настольного уровня. Корпоративный сервер, который я когда-то унаследовал, использовал диски настольного класса и часто видел ошибки, когда контроллер пытался получить информацию о температуре и работоспособности диска от дисков. Поскольку корпоративные контроллеры предполагают, что вы будете использовать корпоративные диски, контроллер не мог корректно обработать диск, который не отвечал на эти запросы (так как это не было поддерживаемой установкой). Это все очень YMMV
bta
0

Как инженер, работающий с RAID-контроллерами, я могу сказать, что для некоторых марок накопителей нередко возникают проблемы с определенными RAID-контроллерами. У каждого диска есть свои особенности, и у каждой модели привода, указанной в списке «совместимых устройств» контроллера, свои особенности будут учитываться контроллером. Чтобы модель привода отображалась в списке, она должна соответствовать стандартам производителя контроллера по производительности и надежности. Любой накопитель, отсутствующий в этом списке, может работать, но, поскольку он не прошел такое же тщательное тестирование, как «одобренные» устройства, YMMV.

В частности, протокол SATA учитывает специфические (нестандартизированные) команды поставщика, которые могут быть определены приводом или контроллером. В вашем случае вы можете видеть контроллер, который ожидает, что диск ответит на определенную частную команду, или диск, который ожидает увидеть запатентованную команду, которая никогда не поступит.

Другая возможность заключается в том, что проблемные накопители не очень хорошо работают при определенных стрессовых рабочих нагрузках, и поведение, которое вы видите, было достаточным для Adaptec / IBM, чтобы не указывать эту модель накопителя как поддерживаемую.

К сожалению, протоколы хранения (SATA, SAS и т. Д.) Не так хороши, как другие стандартизированные интерфейсы (USB, PCI и т. Д.), Где все, что вам нужно, это шина и устройство, говорящие на одном языке, и все в порядке. Особенно когда речь идет о оборудовании корпоративного уровня, производители устройств и производители приводов тратят много времени и энергии на совместную работу, гарантируя, что клиенты получают максимально возможную производительность из конфигураций, используемых большинством клиентов (то есть с использованием дисков от список "поддерживаемых устройств"). Возможно, диск, отсутствующий в этом списке, был разработан для оптимальной работы с контроллером другой марки, а ошибки, которые вы видите, являются побочным эффектом оптимизации.

ВТА
источник