Рекомендации по прошивке и графики обновления

12

Прошивка получает очень мало внимания, когда дело доходит до обновлений. С глаз долой, из сердца вон.

Многие устройства: RAID-контроллеры, сетевые адаптеры, наборы микросхем и даже жесткие диски получают некоторую выгоду от обновления. Лучшие функции, безопасность / исправление ошибок и т. Д.

Большинство SA говорят: «Всякий раз, когда он ломается, обновите прошивку». Но это может привести к трудностям в будущем; Несколько раз при обращении в Dell по поводу неисправного жесткого диска меня спрашивали, обновлена ​​ли прошивка моего жесткого диска. Все мои серверы используют некоторые типы конфигурации RAID. Если у меня уже есть сбой одного диска, стоит ли мне даже пытаться обновить прошивку на остальных дисках или контроллере RAID? Я бы сказал нет. Но у Dell, похоже, другое мнение.

  • Каков реалистичный график обновления прошивки системы?
  • Есть ли у вас какие-либо лучшие практики, чтобы поделиться?

(Мне известно, что у Dell есть замечательная утилита под названием Server Update Utility , которая проверяет все новые прошивки на любом сервере Dell.)

Джозеф Керн
источник

Ответы:

10

Я обновляю прошивку в двух ключевых случаях.

  1. При подготовке сервера.
    • Когда я только получу сервер, я проверю на сайте HP дату их последнего "CD с обновлением прошивки". Если он достаточно новый, я запустлю его на сервере, прежде чем запускать его в производство.
    • Когда я переназначаю сервер. Как правило, этому серверу 2-5 лет, и, вероятно, за все это время не было обновления прошивки. Так как я все равно переформатирую его, я обновлю все различные прошивки на сервере.
  2. Когда определен поставщик, это необходимо сделать.
    • Иногда выявляются серьезные проблемы со стабильностью, такие как невозможность перестроить массив RAID5 после неправильного сбоя или серьезная ошибка производительности в модуле TCP-offload на сетевой карте.
    • Иногда, обращаясь за поддержкой, специалист службы поддержки попросит меня обновить прошивку. Я сделаю это тогда.

Есть третий случай, который я не перечислил выше, потому что это еще не произошло:

  • При размещении гораздо более нового компонента на старом сервере. Иногда системный BIOS необходимо обновить, чтобы справиться с этим.
sysadmin1138
источник
Я думаю, что это отличный баланс.
Джозеф Керн
5

Мы используем HP SIM (System Insight Manager) для развертывания прошивки, мы делаем это по платформам - сначала тестирование, затем разработка, затем интеграция, затем ссылка, а затем, наконец, производство - обычно около недели или около того для каждой платформы, поэтому у нас 5/6 недельный выпуск в производственное окно. Кажется, работает, но одна вещь, которую мы НИКОГДА не делаем, это развертывание прошивки в то же время, что и другие обновления, такие как драйверы / код и т. Д. - экономит много времени.

Chopper3
источник
+1, указывая пальцем, это слишком обычное явление ... похоже, что каждый вторник ...
Джозеф Керн
4

Я мог бы пойти против зерна здесь, но если оно не сломано, не чините его. Если это не проблема безопасности, тогда я оставлю это в покое.

По этой причине у меня никогда не было отказа Dell в обслуживании.

Может быть, вы можете запланировать утилиту один раз в месяц, а затем обновить их с другими перезагрузками?

MathewC
источник
+1 за правду. Если нет веской причины для обновления (например, если поставщик больше не поддерживает ваш комплект, если вы не обновляете BIOS / прошивку), то почему вы это делаете?
RainyRat
Я не работаю со службой поддержки Dell, но все еще застрял в проблеме, которую Intel не будет поддерживать, пока я не обновлю свой BIOS - только я не могу получить чертову вещь для обновления, и иногда я задаюсь вопросом, потому что это единственная обновление слишком много версий впереди того, что работает мой сервер.
Бен Данлэп
1
В принципе, я согласен с вами, но у нас есть некоторые серверы, которые сейчас работают значительно быстрее и стабильнее, чем при покупке, исключительно из-за улучшений прошивки.
Chopper3
Согласовано. Я полагаю, что в этом случае проблемы с производительностью можно было считать «сломанными».
MathewC
Напомним, что недавно я фактически запретил Dell заменять жесткий диск на сервере PowerEdge, пока я не обновил микропрограмму raid-контроллера до последней версии.
Райан Болджер
4

Вы должны относиться к обновлениям прошивки так же, как к исправлениям , хотя эти обновления, как правило, сложнее развернуть, поэтому вы можете проверить примечания к выпуску, чтобы определить, стоит ли оно усилий (но, опять же, вы можете делать это и для исправлений). ). Обновления прошивки, скорее всего, будут содержать новую неприятную ошибку, как и ее исправление.

Обновление прошивки должно выполняться при вводе в эксплуатацию (или при повторном вводе в эксплуатацию оборудования), так как это легко сделать.

Развертывание должно примерно соответствовать следующим направлениям:

  1. Тест на лабораторных машинах
  2. Развертывание в неважных системах
  3. Подождите
  4. Развертывание в важных / производственных системах

Опять же, некоторые вещи не могут следовать за этим. В частности, очень важно очень быстро распространять исправления Microsoft на рабочие столы Windows, а тестирование сложно выполнить быстро без значительных ресурсов.

Toto
источник
2

Я обычно обновляю прошивку при вводе в эксплуатацию любого нового оборудования инфраструктуры. Рабочие станции и принтеры обновляются только в том случае, если существует конкретная проблема, такая как исправление ошибки или проблема безопасности. С серверами это менее важно, так как по большей части код прошивки либо не выполняется после процесса загрузки, либо настолько прост, что мало что может пойти не так.

У меня был неудачный опыт обновления микропрограммы RAID на серверах, так как многие производители не гарантируют, что текущая конфигурация RAID будет жизнеспособной, если изменится версия микропрограммы, то же самое с отдельными дисками в массиве.

Моя тенденция состояла бы в том, чтобы по большей части применять политику «если не сломано, не исправляйте». Стоит проверить, возможно ли восстановление после неудачного обновления программного обеспечения (т. Е. Избыточного ПЗУ на серверах HP, или если у вас есть флеш-память EEPROM и вы хотите использовать ее в качестве съемного чипа).

Ричард Слейтер
источник
Как часто вы проверяете наличие «проблем безопасности» на разных прошивках?
Джозеф Керн
Практически весь наш комплект - HP, зарегистрировав продукт, я регистрирую общую учетную запись для «уведомлений о прошивке, драйверах и безопасности», и если я уйду, я перенаправлю эту учетную запись своему преемнику.
Ричард Слейтер
2

Я не могу говорить о Dell, но многие люди в группе хранения IBM говорили мне, что первые уровни их встроенного ПО RAID НИКОГДА не являются лучшими. Сначала они стремятся к стабильности, а затем повышают производительность с будущими уровнями оборотов. К сожалению, немногие из нас думают (или, возможно, имеют смелость), чтобы вернуться позже и возиться с прошивкой RAID здоровой системы, если не было проблем. Итак, наша стратегия заключалась в том, чтобы обновлять уровни встроенного ПО RAID каждый раз, когда мы настраиваем новый сервер, предполагая, что адаптер RAID не является фирменной шлепающей новой моделью. Таким образом, мы, по крайней мере, получаем лучшие уровни производительности, доступные в то время. Если это новый адаптер режима, мы постараемся сделать пометку, чтобы вернуться через несколько месяцев и проверить наличие обновлений, но мы не религиозны в этом.

На материнских платах мы НЕ связываемся с ними, если только техническая поддержка производителя не сообщит нам. Наш многолетний опыт показывает, что, если нет конкретной проблемы, которую необходимо решить, риски значительно перевешивают трудноизмеримые выгоды.

// SPK

Скотт Кантнер
источник
1

Я успешно использовал SUU и аналогичные продукты HP и IBM. Единственные проблемы, с которыми я когда-либо сталкивался, заключались в том, что для замены драйвера Dell использовался драйвер поставщика без каких-либо технических причин, из-за чего обновление SUU не привело к обновлению OM на сервере Dell. Мы обновляли микропрограммы и драйверы на нескольких сотнях серверов не реже двух раз в год, чтобы поддерживать их актуальность. Мы никогда не сталкивались с проблемами с прошивкой RAID.

Митч
источник
Расскажи мне больше ...
Джозеф Керн
Мы следили за выпусками Dell, я думаю, ежеквартально, чтобы запланировать изменения, чтобы применить обновления. Мы применили бы их ко всем компьютерам Dell на всех поддерживаемых нами клиентах. Возможно, нам повезло, но у нас было очень мало проблем, я думаю, что это также сводилось к тому, чтобы иметь план и держать вещи в актуальном состоянии. Когда мы взяли на себя новые серверы, первое, что мы сделали, - довели все товары до текущего уровня.
Митч
1

Мы обновляем прошивку при каждом удобном случае, что, к сожалению, возможно, 3-4 раза в год (основные окна обслуживания) для некоторых систем.

Джейсон Тан
источник
0

Если вы прочитаете сообщение, сопровождающее обновление прошивки Dell, то обнаружите, что оно классифицирует обновление как критическое, важное или какое-либо другое и описывает, что исправление исправляет (не всегда так ясно, как хотелось бы!).

Я считаю, что я не буду применять обновление прошивки без веской причины. Если это критическое обновление и оно устраняет проблему, с которой у меня есть разумные шансы, тогда да, я буду ее применять, даже если это напряженный бизнес.

Как вы говорите, службы поддержки Dell обычно настаивают на применении любых соответствующих обновлений до того, как они будут поддерживать вас, и, очевидно, в этом случае у вас нет большого выбора. Вы можете понять, что Dell не хочет тратить впустую время инженера, хотя я никогда не знал, что причиной вызова службы поддержки является прошивка.

JR

Джон Ренни
источник
0

Я думаю, это зависит от типа среды, с которой вам приходится иметь дело. Если вы работаете в среде, требующей высокой доступности, и не можете перезагрузить серверы, когда хотите. На мой взгляд, лучшая практика заключается в реализации графика технического обслуживания. Выберите период времени для каждой системы, уведомите пользователей и выполните всю необходимую работу, включая обновления прошивки, в течение этого выделенного периода времени. Таким образом, вы можете быть уверены, что все ваши системы обновлены и одновременно минимизируют влияние на производство. Также, как было отмечено в комментариях ранее, необходимо проверять наличие обновлений прошивки при создании нового сервера.

user176320
источник