Нужно ли использовать RAID-карты Fusion-io?

27

Могу ли я надежно работать с одной картой Fusion-io, установленной на сервере, или мне нужно развернуть две карты в настройке программного RAID?

Fusion-io не очень ясно (почти вводит в заблуждение) тему при рассмотрении своих маркетинговых материалов. Учитывая стоимость карт, мне любопытно, как другие инженеры используют их в реальных сценариях.

Я планирую использовать фирменную карту HP Fusion-io ioDrive2 1,2 ТБ для проприетарного автономного решения для баз данных, работающего в Linux. Это установка с одним сервером без реальной опции высокой доступности. Там вне асинхронная репликации с 10-минутной RPO , что зеркала журналов транзакций на второй физический сервер.

Традиционно для этого приложения я бы указал высокопроизводительный сервер HP ProLiant с верхним степпингом ЦП. Мне нужно перейти на SSD, и я могу приобрести Fusion-io по более низкой цене, чем корпоративный SAS SSD для требуемой емкости.

  • Нужно ли запускать две карты ioDrive2 и соединять их с программным RAID (md или ZFS), или это не нужно?
  • Должен ли я беспокоиться о сбое Fusion-io больше, чем о сбое контроллера RAID или материнской плате?
  • Системным администраторам нравится RAID. Требуется ли для этого другое мышление, учитывая другой интерфейс и встроенное выравнивание износа / исправление ошибок, доступное в этом форм-факторе?
  • Что IS частота отказов этих устройств?

Редактировать: я только что прочитал документацию по надежности Fusion-io от Dell, и мне кажется, что на этом вопросе «карты Fusion-io имеют много внутренних избыточностей ... Не беспокойтесь о RAID !!» ,

ewwhite
источник
Сможет ли программный рейд и / или шина PCIe даже поддерживать работу, если вы превышаете лимит IOPS? Честно говоря, понятия не имею, но стоит проверить.
Пауска
1
Шина PCIe будет поддерживать. Программный RAID (если мне это нужно ) будет основан на ZFS, так что он способен. Я заказал две карты на данный момент, но литература Fusion-io, кажется, говорит: «Одна карта достаточно хороша».
Ewwhite
Даже ZFS необходимо использовать циклы ЦП для зеркального отображения данных, поэтому это добавляет сложность и задержку, но невозможно сказать, насколько это повлияет на ваше конкретное приложение. Fusion, похоже, очень гордится своей низкой стоимостью процессора на внутреннем зеркалировании / защите ..
pauska

Ответы:

16

В конечном счете, все сводится к вашей модели отказа. Каково влияние отказа?

Исторически сложилось так, что мы всегда использовали RAID, так как затраты на это были незначительны. Еще 500 долларов за диск для зеркалирования? Абсолютно стоит затрат, даже не учитывая это.

Когда вы говорите о еще $ 10K +, чтобы включить зеркалирование, это требует немного больше внимания.


Нет, вам не нужно зеркалировать

В Fusion-IO карты действительно имеют очень хорошую внутреннюю избыточность. Это не тот тип оборудования, где ваш диск представляет собой один чип. В большинстве случаев, когда я наблюдал сбой, это была проблема с микропрограммой, которая затрагивала оба элемента зеркала, поэтому RAID не имел значения.

Думайте о карте Fusion-io как о контроллере RAID с дисками позади нее. Вы в порядке с настройкой одного контроллера? Вероятно. Относись к этому так.

Во многих установках, где вы будете развертывать диски Fusion-io, у вас будут встроены другие средства защиты (избыточность на уровне узла), так что это не имеет особого смысла.


Да нужно зеркало

RAID увеличивает вашу доступность . Вам нужна абсолютная максимальная доступность, несмотря на стоимость? Дорого ли обходится отказ и возможное время простоя? Идите и зеркало зеркал. В статистически большой конфигурации у вас будут сбои дисков, несмотря на внутренние меры безопасности.

MikeyB
источник
Обновление: я отразил карты Fusion-io в установках, где с клиентом все в порядке с дополнительными затратами (и для облегчения развертывания продукта). Я развернул ряд установок с одной картой в других ситуациях. Пока все было хорошо ...
2011 г.
18

Резервирование на устройстве должно отлично справляться с отказами флэш-микросхем - аналогично RAID для всех компонентов, которые выполняют фактическое хранение данных.

Должен ли я беспокоиться о сбое Fusion-io больше, чем о сбое контроллера RAID или материнской плате?

Отказ всего устройства был бы в значительной степени аналогичен потере контроллера RAID или материнской платы - я бы примерно так же беспокоился о плате Fusion-io, как и эти другие компоненты с одной точкой отказа, хотя я не Я имею опыт работы с устройствами в больших масштабах, чтобы иметь возможность сравнивать частоту отказов с использованием достоверных данных.

Нужно ли запускать две карты ioDrive2 и соединять их с программным RAID (md или ZFS), или это не нужно?

Добавление избыточности в дополнение к тому, что устройство уже имеет (скажем, программный RAID среди нескольких карт Fusion-io), будет во многом похоже на программный RAID между двумя аппаратными группами RAID на двух разных контроллерах RAID; может быть целесообразно для систем, требующих чрезвычайной избыточности, удалить дополнительную единственную точку отказа, но не для обычных развертываний (10-минутный RPO на зеркале должен быть достаточно хорош для большинства приложений?).

Сисадминам нравится RAID. Требуется ли для этого другое мышление, учитывая другой интерфейс и встроенное выравнивание износа / исправление ошибок, доступное в этом форм-факторе?

Думаю, да. По сути, вы получаете устройство, похожее на контроллер RAID, и кучу устройств хранения за ним в одном пакете. Определенно заманчиво беспокоиться о том, чтобы поместить ваши конфиденциальные данные на одно устройство, но нужно иметь некоторый уровень доверия к внутренней избыточности устройства ... Что должно быть сбалансировано со здоровым пониманием того, что «RAID не является Концепция резервного копирования : всегда будьте готовы к отказу избыточного компонента или удалению пользователем данных с хорошими резервными копиями.

Шейн Мэдден
источник
13

Как вы знаете, мы использовали их комплект некоторое время, как в RAID, так и не в RAID-настройках - хотелось бы, чтобы у меня был какой-то опыт неудачи, но я этого не сделал. У нас не было сбоев, с которыми мог бы помочь RAID, и их встроенные функции устойчивости только улучшаются. Кроме того, основная функция, для которой мы их используем, теперь масштабируется / кластеризуется по горизонтали, поэтому у нас еще меньше оснований для их RAID. Большие карты, хотя, очень рекомендую их.

Chopper3
источник
Хорошая точка данных. Тем не менее, я просто не могу сказать, является ли добавление уровня RAID излишним или нет.
ewwhite
1
Я считаю, что эта технология не является определяющим моментом - либо ваши данные нуждаются в способности поддерживать потерю одной карты FusionIO, либо нет - просто представьте, что они - быстрые, дорогие диски - это не меняет вас может жить без RAID или не правильно?
Chopper3
Немного ... Традиционный подход заключается в использовании корпоративных SSD-дисков SAS в RAID 1 + 0. Это просто применение того же стандарта, который используется для вращения дисков к твердотельным накопителям. Но это также предполагает горячую замену. Это не относится к платам на основе PCIe, особенно когда я вынужден использовать программный RAID для этого. Поскольку Fusion-io также имеет преимущество в улучшении выравнивания износа и контроля, я пытаюсь понять, какие здесь реалистичные режимы отказов. Я отношусь к Fusion-io как к дискам или контроллеру? Вы бы не поместили две карты Smart Array в ProLiant для обслуживания внутренних дисков, верно?
августа
2
@ewwhite У вас может быть два RAID-контроллера с разными дисками и RAID1 между дисками контроллеров, если вам необходимо справиться с отказом RAID-контроллера. Я бы сказал, относитесь к карте Fusion-io как к контроллеру RAID с точки зрения планирования резервирования.
Шейн Мэдден
@ewwhite Если вы посмотрите на формулировку, которую я использовал, вы можете прочитать между строк, что у нас произошел один сбой на одном сервере, оборудованном FusionIO - у нас был mobo go pop - DL580 G6 (у нас их очень мало) и что-то еще случилось с одним целым банком памяти, и он вынул плату «кто». В этом сценарии это был RAID 1, но это, очевидно, не имело значения. Конечно, имейте в виду, что PCIe может быть с горячей заменой, это может быть большой недостаток, но он может работать нормально.
Chopper3
9

Я не знаком с Fusion напрямую, но у меня есть опыт работы с PCIe SSD.

Те, с которыми я работаю, представляют четыре разных LUN для ОС и рассматривают карту PCIe как HBA. Если я хочу RAID, я бы зеркалировал два LUN вместе, используя ОС. Это позволяет мне использовать однокарточное решение для резервирования. Хотя, если карта не сработает, я все равно получаю ручей. Я не знаю, делает ли ioDrive то же самое.

sysadmin1138
источник
Этот конкретный блок представит одно блочное устройство.
2013 года
1
ioDrives представляет одно или два независимых устройства. Если он представляет два, это физически два отдельных устройства на одной карте, каждое со своей собственной внутренней защитой. Сравните, скажем, с Intel 910, который представляет четыре устройства, каждое из которых должно рассматриваться как SSD.
MikeyB
5

Я купил 6 карт по 1,2 ТБ за последние пару месяцев. Один из них уже провалился. Поэтому я бы совершил на них рейд. Я использовал windows active disk mirror. Сбой привода с сообщением «отсутствует карта LEB». Мне сказали, что это нужно будет заменить. Но чтобы получить одобрение RMA, мне нужно было сделать снимки с обеих сторон неисправной карты (требуя остановки производства, чтобы вынуть карту). И тогда они сказали мне, что запасной карты не было в наличии без этого. Так что вы можете подумать, прежде чем купить их.

user229000
источник
Спасибо за обмен вашего опыта. Я пошел дальше и развернул эти 1,2 ТБ карты в зеркальных парах. Я использую SKU HP, поэтому у меня есть контракт на поддержку HP для обработки RMA / замены.
ewwhite