Какое время лучше всего запланировать регулярные обновления на собственном производственном сервере?

9

Учитывая наличие внутреннего сервера, работающего в производственном режиме, я бы хотел, чтобы влияние на пользователей было как можно ниже при развертывании регулярных обновлений (на самом сервере, а не на пользовательских машинах ... но это было бы довольно похожей проблемой).

Очевидный ответ на мой вопрос «ночью, когда пользователи дома». Но «ночь» - это длительный период времени. Нужно ли начинать рано вечером, чтобы, возможно, поймать проблемы с обновлением на раннем этапе и быть готовым к откату? Или лучше начать рано утром и использовать первых пользователей как «морских свинок», чтобы быстрее вызвать проблемы? Или посреди ночи, когда концентрация тех, кто наблюдает за обновлением, довольно низка, но гарантированно не будет никаких дескрипторов открытых файлов некоторых поздних работающих пользователей?

Есть ли исследовательские работы по этой теме?

Акира
источник

Ответы:

5

Почему бы не посмотреть на одновременное использование вашей системы исторически и определить, в какое время дня использование минимально? Затем вставьте свои изменения прямо в середине этого периода низкого использования.

При определении того, сколько времени займет изменение, включите тестирование до и после внедрения, а также тестирование с проверкой производства. Кроме того, определите, сколько времени потребуется для отката в случае неудачного тестирования.

ИМХО, ваши «первые пользователи» не должны быть морскими свинками. Наличие живых пользователей в основном для проверки производственной проверки ваших изменений не очень хорошая вещь. Это разрушает доверие конечных пользователей, и неожиданные результаты могут испортить производство, что означает, что вам нужно не только откатить изменения, но и откатить любой «ущерб», который могло вызвать изменение.

Я не знаю ни одной исследовательской работы, но взгляните на любую инфраструктуру управления ИТ-услугами (ITSM), такую ​​как ITIL, вы найдете множество стандартов и лучших практик управления выпуском программного обеспечения. Все системы разные, поэтому зависит от того, сколько практики вы принимаете, и от формальности. Стандарты ITSM имеют в виду большие системы.

Ник Кавадиас
источник
стандарты и лучшие практики не выпадают из воздуха, поэтому меня заинтересовало «оригинальное» исследование. но все равно спасибо.
Акира
Да, я понимаю, что стандарты не возникают из ниоткуда; заявляя о своем незнании исследовательских работ в этой области.
Ник Кавадиас
5

Это полностью зависит от характера бизнеса. Некоторые офисы работают 9-5 дней в неделю. Другие предприятия работают 24 часа в сутки, 365 дней в году. Другие факторы, такие как наличие персонала и ресурсов, играют важную роль. Ни один исследовательский документ не может всесторонне охватить каждый возможный график или случайность.

В конечном счете, руководство компании или департамента совместно с ИТ-менеджментом должны определить, что лучше.

Ключом к успеху является общение с пользователями, когда запланировано время простоя, сколько времени он продлится, какая требуется подготовка пользователей и что они могут ожидать в результате успеха или неудачи. Большая часть этого соответствует ожиданиям, которые вы установили.

В конце ничего не выгравировано в камне. Если процесс не работает, внесите коррективы. Ваша гибкость и адаптивность будут оценены.

Выполняя процедуры технического обслуживания и обновления тестового оборудования, когда это возможно, вы будете лучше подготовлены к внедрению их в производственные системы.

Приостановлено до дальнейшего уведомления.
источник
Уильямсон: исследование: можно было бы измерить, сколько общих администраторов делают свои обновления в какое время дня и испытывают ли они больше ошибок утром или вечером. даже если определенный администратор должен действовать так, как он делает в данное время, чтобы соответствовать обстоятельствам компании: если исследование показывает, что он находится в часовом поясе «ошибки», то, возможно, он может немного изменить ситуацию. мне было любопытно, когда люди действительно делают свои обновления, первые два ответа выбрали именно «вечер» и «утро» :)
akira
1
Начните с начала вашего согласованного окна отключения. Это дает вам больше всего времени для исправления ошибок.
mfinni
чтобы быть справедливым, это тот тип «в основном здравого смысла», о котором мы обычно забываем упоминать.
mfinni
3

Я работаю у интернет-провайдера, и, по моему опыту, большинство людей, которых я бы назвал системными администраторами, предпочитает вечерние пятницы в выходные дни, чтобы провести капитальный ремонт своей сети. Это дает им дополнительные 24 часа на тестирование и, если необходимо, откат их изменений. Тем не менее, в значительной степени это полностью зависит от характера и привычек ваших пользователей.

Ллойд Бейкер
источник
1
Мы делали то же самое, когда я работал в университете - каникулы также означали, что люди с меньшей вероятностью будут рядом, но в зависимости от типа бизнеса это может иметь противоположный эффект.
Джо Х.
да, но здесь я стремлюсь к "ежедневным" обновлениям. если время простоя составляет 48 часов ... тогда это действительно очевидный выбор.
Акира
@akira: никто в здравом уме не делает обновления ежедневно
Zypher
2

Мы устанавливаем обновления в 9 вечера, достаточно поздно, большинство людей не будут включаться, достаточно рано, чтобы вытянуть всю ночь, если это необходимо.

Крис С
источник
2

В моем случае мы устанавливаем обновления в 4 часа утра, чтобы избежать влияния на пользователей, даже тех, кто работает немного поздно.

Если у вас есть хорошая система мониторинга, которая предупреждает вас о возникновении проблемы, вы сможете исправить ее рано утром, даже не выходя на работу.

Флоран Кортай
источник
1

Это действительно зависит от характера вашего бизнеса, но я лично предпочитаю среду вечером после 5 вечера. Вы никогда не хотите делать это по вечерам в пятницу, потому что если что-то пойдет не так, вы будете работать в выходные. Выполнение этого в среду даст вам четверг и пятницу, чтобы исправить проблемы, если таковые имеются.

Другим важным фактором является планирование окон управления изменениями. Очень важно, чтобы люди знали, что вы выполняете техническое обслуживание, - что службы могут быть прерваны или недоступны в течение этого периода. Это позволит вам работать с уверенностью, а не беспокоиться о том, что пользователи будут жаловаться на то, что сервисы не работают. Разумеется, вашему руководству необходимо утвердить окна изменений.

Marseille07
источник