Недавно мне рассказали о некоторых проблемах, связанных с RAID-массивами Parity без энергонезависимого кэша. Более дорогие HW-контроллеры имеют кэши на батарейках для завершения операций записи в случае сбоя питания. Теперь некоторые люди говорят, что такой сбой, возможно, в сочетании с поврежденным массивом, может убить всю вашу файловую систему. Другие утверждают, что эти проблемы устарели и / или заблуждения .
К сожалению, никто не дает жестких ссылок, и ни поиск md RAID и энергонезависимого кэша , ни кэширование растровых изображений не дает надежных ответов о том, рекомендуется ли md-RAID5 или нет.
Любая информация об этом?
Ответы:
Я предполагаю, что программный RAID Linux так же надежен, как аппаратная карта RAID без BBU и с включенным кэшированием обратной записи. В конце концов, незафиксированные данные в программной системе RAID находятся в буферном кеше ядра, что является формой кеширования с обратной записью без резервного копирования батареи.
Поскольку каждая аппаратная карта RAID-5, которую я когда-либо использовал, позволяет включать кэширование с обратной записью без BBU, я ожидаю, что программный RAID-5 может нормально работать для людей с определенным уровнем допуска к риску.
ObWarStory:
При этом я лично столкнулся с серьезной потерей данных из-за отсутствия BBU на карте RAID-5, хотя было включено кэширование с обратной записью. (ИБП тоже нет. Не кричи на меня, не мой звонок.)
Мой босс вызвал меня в панике, когда я был в отпуске, потому что одна из наших производственных систем не работала после отключения электричества. У него кончились вещи, чтобы попробовать. Мне пришлось съехать на обочину, вытащить ноутбук, включить WiFi-модем на моем телефоне,
ssh
в пораженную систему и починить его, пока моя семья сидела со мной на обочине дороги, пока я не закончил восстановление таблицы перемещенной базы данных из резервной копии. (Мы были примерно в миле от потери приема клетки в то время.)Так скажите мне: сколько бы вы заплатили за карту RAID + BBU сейчас ?
источник
Просто предупреждение: операции записи RAID-5/6 занимают значительное процессорное время, пока ваш массив ухудшается. Если ваш сервер уже полностью загружен, когда диск выходит из строя, он может упасть в пропасть без ответа. Такой проблемы не будет с аппаратным RAID-контроллером. Поэтому я настоятельно рекомендую не использовать программный RAID-5/6 на производственном сервере. Для рабочей станции или слегка загруженного сервера это нормально.
источник
SW RAID имеет режим сбоя - если сервер выходит из строя в середине записи, вы можете получить поврежденную полосу. Контроллер HW RAID с BBU не так уж и дорог, и он будет сохранять грязные блоки, пока вы не перезагрузите диски.
BBU на кэш делает не гарантирует запись в случае сбоя питания (т.е. он не питает диски). Он включает кэш на несколько дней, пока вы не сможете перезапустить диски. Затем контроллер сбросит все грязные буферы на диск.
Некоторые заметки о SW vs. HW RAID-5
Запись на том SW RAID-5 может быть медленной, если для блокирования ввода-вывода используется сквозное кэширование, поскольку вызов не возвращается до тех пор, пока не завершится весь ввод-вывод. Контроллер HW RAID с BBWC может значительно оптимизировать это, так что вы можете видеть значительно лучшую производительность.
В прошлый раз, когда я посмотрел, вы не могли выполнить прямой ввод-вывод (т.е. DMA с нулевым копированием) на томе RAID RAID. Возможно, это изменилось и действительно имеет отношение только к приложениям, таким как менеджеры баз данных, использующим необработанные разделы.
Современный контроллер SAS RAID может извлекать или выгружать данные 1 ГБ / с или больше с дискового массива, особенно если отформатирован с большим (скажем, 256 КБ) размером полосы. Я даже протестировал более старый адаптер Adaptec ASR-2200 на скоростях, которые показали, что он в совокупности насыщает оба своих scsi-канала со скоростью 600 МБ / с + (10x 15k дисков) при очень небольшой загрузке ЦП на хост-машине. Я не уверен, что вы могли бы получить это из программного RAID-5 без большой загрузки процессора, если вообще, даже на современной машине. Может быть, вы могли бы прочитать это быстро.
Конфигурация для загрузки с тома HW RAID проста - том RAID прозрачен для O / S.
Младший RAID-контроллер от поставщика первого уровня, такого как adaptec, не так уж и дорог по розничным ценам, и его можно купить за арахис от ebay. Но помните, что если вы покупаете подержанные товары, обращайтесь к поставщикам первого уровня и убедитесь, что вы знаете модель и проверяете доступность драйверов на их веб-сайте.
Редактирование: из комментария @ psusi убедитесь, что у вас нет контроллера fakeraid (прозрачный SW RAID скрыт в драйвере), но большинство предложений от больших имен (Adaptec, 3Ware или LSI) не являются модулями fakeraid. Все, что может взять BBU, не будет подделкой.
источник
Если вы получили данные в кэш-памяти, но еще не на диске, и при отключении питания эти данные исчезнут, и ваш диск, скорее всего, окажется в несогласованном состоянии. Вероятность этого не очень высока, если у вас нет системы, которая постоянно пишет, но я все равно не хотел бы ставить свои данные на вероятностные игры.
Интересно было бы создать основную файловую систему на RAID5 / 6, но поместить журнал на обычный диск, чтобы данные сначала сбрасывались на обычный диск. Производительность, вероятно, пошла бы на пользу, так как вы были бы ограничены скоростью записи одного диска, но надежность возрастала бы. Поэтому я предполагаю, что в ситуации, когда ваша производительность записи не важна, но ваше чтение таково, что это может работать просто отлично.
Или вы можете просто потратить еще 100 $ и получить карту с BBU или небольшой ИБП, и вообще избежать всех этих осложнений;)
источник
Программный рейд Linux mdadm разработан так же надежно, как аппаратный рейд с кэшем с резервным питанием от батареи. Нет проблем с внезапной потерей питания, кроме тех, которые также относятся к внезапной потере мощности на одном диске.
Когда система восстанавливается после сбоя питания, массив будет повторно синхронизирован, что в основном означает, что четность пересчитывается для соответствия данным, которые были записаны до сбоя питания. Это займет некоторое время, но на самом деле ничего страшного. Время повторной синхронизации может быть значительно уменьшено, если включить битовую карту с намерением записи.
источник
Вот блог, объясняющий проблему с RAID5 и как ZFS RAIDZ решает ее .
Его ключевые моменты:
а также
источник