Как часто нужно перезагружать серверы Windows?

77

Немного предыстории: у нас есть несколько серверов Windows (2003, 2008) для нашего отдела. Мы подразделение ИТ, поэтому мы управляем своими собственными серверами. Из четверых из нас здесь я единственный с небольшим знанием ИТ. (Обратите внимание на «небольшое количество».) Мой начальник говорит, что серверы необходимо перезапускать хотя бы раз в неделю. Я не согласен. Наш ИТ-отдел говорит, что из-за того, что она постоянно перезагружает их, по этой причине наши жесткие диски выходят из строя и на них отключаются источники питания. (Это случилось с несколькими нашими серверами пару раз за последние четыре года, и совсем недавно.)

Итак, вопрос: как часто все перезагружают свои серверы Windows? Есть ли отраслевой стандарт или рекомендация? Правильно ли говорит наш ИТ-отдел, потому что мы перезапускаем, поэтому у нас проблемы с оборудованием? (Мне нужна причина, если я собираюсь изменить ее мнение!)

Evan
источник
111
О, примерно каждый второй вторник месяца . :)
Джскотт
4
Dang! Мы делали каждый четвертый четверг месяца! :)
Эван
2
Я в противоположной лодке. Нам не разрешено перезагружать серверы без еженедельных дебатов между всеми отделами, которые занимают около 12 человеко-часов на сервер. Да, это включает в себя перезагрузки для исправления, что фактически означает, что это никогда не будет сделано.
Hyppy
19
Перезапуск еженедельно не должен привести к резкому увеличению отказов оборудования.
JamesRyan
3
Похоже, ваши серверы перезагружаются чаще, чем мой ноутбук. Я вообще это в режиме сна, когда я не использую его. Обычная причина перезагрузки - установка обновлений Windows или программного обеспечения.
Фил

Ответы:

116

Мой босс говорит, что серверы нужно перезапускать хотя бы раз в неделю

Я категорически не согласен. С хороших дней [NT, кто-нибудь?] Microsoft добилась больших успехов в плане стабильности и времени безотказной работы. Жаль, что консенсус в сфере ИТ-поддержки не изменился вместе с этим.

Как часто все перезагружают свои серверы Windows?

Только при необходимости - либо из-за обновления ОС / программного обеспечения, критического сбоя программного обеспечения, который не может быть восстановлен другими способами, обновления / замены оборудования или других действий, которые не могут произойти без перезапуска. 1

Есть ли отраслевой стандарт или рекомендация?

Я никогда не видел стандартную рекомендацию как таковую , но я не мог согласиться ни с одной рекомендацией (кроме как от самих MS), которая указала бы на требуемую перезагрузку через определенный интервал времени «просто потому что».

Правильно ли говорит наш ИТ-отдел, потому что мы перезапускаем, поэтому у нас проблемы с оборудованием?

Перезапуск [и, более того, включение / выключение питания] является наиболее напряженным периодом аппаратной активности для компьютера. У вас есть все, что крутится до 100% - диск и вентиляторы ... ... а также значительные колебания температуры компонентов. Современное оборудование невероятно устойчиво, но это не должно быть причиной просто прыгающих серверов, по прихоти, несколько раз в неделю.

1 Кроме того, я ненавижу, когда технические специалисты «просто» перезагружают сервер Windows в случае сбоя службы или тому подобного. Я понимаю необходимость возобновления работы службы, но перезагрузка должна быть последним шагом при устранении неполадок сервера. Выявление и устранение [!] Первопричины сбоя почти никогда не должно приводить к «Meh, просто перезагрузите его ....»

оборота
источник
2
Спасибо за подробный ответ. Мы делаем обновления один раз в месяц, что, очевидно, когда мы делаем те, мы должны перезапустить. Я ценю ответ.
Эван
5
Я должен не согласиться с вашим дополнением. Если служба определяет сервер (например, NFS-сервер, который прекращает совместное использование экспорта), и вы знаете, что чистая перезагрузка вернет службу в течение X минут, а после базового устранения неполадок вы решите, что для решения проблемы потребуется + 5 вопрос, наиболее целесообразно просто перезагрузиться. Вы можете сделать анализ причин впоследствии. Так вот, в любом случае, это мой метод, и вы могли бы легко и против него спорить :) Просто как я катаюсь.
Мэтью
34
@ Матфея: Выполнение анализа первопричин после этого все хорошо и хорошо, если нет временной информации о причине, потерянной при перезагрузке. Я думаю, что говорю от имени нескольких людей, когда говорю, что предпочел бы иметь еще одно увеличенное время простоя, чтобы выявить и устранить основную причину сбоя, чем ряд более коротких простоев, когда я решу «просто перезагрузиться» и потенциально может потерять способность использовать изменчивую информацию, чтобы помочь в анализе первопричин.
Эван Андерсон
8
@ Matthew В случаях сбоев в работе службы я бы ожидал, что технический специалист попытается перезапустить службу в качестве шага устранения неполадок перед перезагрузкой всего блока.
Джскотт
6
@ Эван Я согласен с вами, но я думаю, что должен быть порог инцидентов, которые становятся проблемой. Например, если это происходит один раз в месяц и устраняется за 10 минут с перезагрузкой, бизнес может никогда не заботиться о первопричине. Я думаю, что вы и я хотели бы знать, но время безотказной работы является более важным, чем основная причина. Однако, если это происходит 3 раза в неделю, это совсем другая история.
Джим Б.
52

Серверы Windows необходимо ежемесячно перезагружать, если вы применяете исправления. Вы применяете патчи, верно? Правильно?

Hyppy
источник
8
+1 за то, что сделал меня лол
3
Вы используете патчи только ежемесячно?
Джон Гарденье
Строго говоря, xe применяет только те исправления, которые сами требуют ежемесячной перезагрузки . Не все PTF требуют перезагрузки, и не все ежемесячные обновления вообще содержат какие-либо исправления.
JdeBP
2
Я только перезагрузки серверов Windows , когда обновление требует его. Иногда это может пройти пару месяцев без патча, требующего перезагрузки. Однако у меня есть серверы Linux, которые годами не перезагружались и работали без сбоев. Я думаю, что самое длинное, что я видел в своей сети, это ящик Linux, который был помещен в шкаф и забыт (он получал автоматические обновления). Я ssh'd в и время работы было в 3 года. Год спустя он был перезагружен из-за сбоя питания.
Джеймс
Если бы это был Linux или BSD, вы могли бы исправить свой сервер без перезагрузки. Вы должны перезагрузить компьютер только для обновлений ядра (а в случае с ориентированным на сервер дистрибутивом они встречаются редко).
SnakeDoc
18

Я дам альтернативный ответ для очень конкретного случая. Достижения последних 2-3 лет, возможно, изменили это, но если у вас интенсивно используются серверы TS или Citrix, на которых запущено много интерактивных приложений (например, Office), было бы неплохо делать еженедельные перезагрузки в нерабочее время, просто начать с чистого листа для таких ресурсов, как застрявшие сеансы, использованная куча рабочего стола и т. д. Если вы правильно настроили свою ферму и сделали перезагрузку, даже если у вас мало времени использования, пользователи не должны подвергаться воздействию.

Конечно, это обычные перезагрузки серверов, но они используются как настольные компьютеры.

mfinni
источник
4
Мм ... хороший вызов по делу TS / Citrix.
Hyppy
Подобный опыт использования Citrix с программным обеспечением CCH для управления аудитом
1
То же самое применялось еще во времена MetaFrame, когда сами Citrix рекомендовали ночные перезагрузки, если это было целесообразно.
Джон Гарденье
Да, Метафрейм ... Ух ты. Я не скучаю по игре с файлом сопоставления драйвера принтера. Это, безусловно, стало намного лучше с точки зрения управления ИТ.
mfinni
10

Это скорее политический и психологический вопрос, чем технический.

По моему опыту, некоторые люди, которые работали с некоторыми из более старых версий Windows, поняли, что им нужно еженедельные перезагрузки, и они сохранили эту философию в своем маленьком уголке (они, кажется, никогда не замечают, когда хотя перезагрузка пропущена, когда они в отпуске). Если у вас нет очень нестабильных систем и приложений, они больше не основаны на реальности.

С другой стороны, частые перезагрузки могут катализировать аппаратный сбой, но вряд ли причина его возникновения.

Шейн Мэдден
источник
7
Мой босс хорошо дружит с отставным сетевым администратором, который сказал ей, что их нужно перезагрузить хотя бы раз в неделю ... что объясняет, почему она так непреклонна в этом. Спасибо за ответ.
Эван
5
Не удивительно, что он "на пенсии" ... это эвфемизм для уволенных?
Котро
3

Единственный раз, когда они должны быть перезапущены, для технического обслуживания, если все работает правильно . Запланированные перезагрузки действительно являются обязательным требованием только при A) обновлении программного обеспечения, B) выполнении технического обслуживания оборудования или C) устранении утечки памяти, которая не может быть устранена путем перезапуска вызывающего ее программного обеспечения / службы. Хотя Windows не известна в течение длительного времени бездействия, это случается (на прошлой работе было несколько коробок Win2k, которые работали месяцами - они просто работали). Просто помните, что любое исправление, скорее всего, потребует перезагрузки.

Мэтью
источник
Спасибо за ответ. Это должно помочь убедить ее.
Эван
1
Я нашел Windows NT, 2000 и 2003 Boxes в рабочей сети, которые были запущены в течение нескольких лет. и до недавнего времени в нашем дата-центре применялась ежегодная политика исправлений, и с более чем 600 серверами нередки случаи простоя в диапазоне более 250 дней. Мои серверы (у меня их около 120) обновляются и загружаются при каждом исправлении Microsoft. Иногда, как в прошлом месяце, у нас не было цикла. Время работы зависит от того, что работает на сервере и насколько хорошо все работает вместе. 2003 R2 с тем, что мне нужно запустить, необходимо перезагружать каждые 35 дней. забавные вещи случаются после этого.
Кристофер Торнтон
2

Я ни в коем случае не эксперт в данной области, но в зависимости от того, какие службы у вас запущены, некоторые могут быть подвержены переполнению при определенных функциях синхронизации, таких как timeGetTime () и getTickCount ().

TimeGetTime имеет 32-битный результат, который равен количеству миллисекунд с момента запуска компьютера. Это максимально около 49,7 дней.

Мэтью
источник
2
Нет, нет У меня есть сервер (на полностью изолированную, доверенную сеть - не проповедует мне) , что было для лучшей части 14 месяцев с NO побочных эффектов.
Бен Пилброу
3
Я не имел в виду, что у каждого сервера и экземпляра будет эта проблема, но если сервер использует программное обеспечение, которое использует эти функции и не учитывает их, возникнут вычислительные проблемы.
Мэтью
2
Проблема с 32-разрядным таймером действительна, но это проблема, которую отдельные поставщики программного обеспечения должны тщательно избегать в своем собственном коде. Windows больше не подвержена сбоям, связанным с этим таймером (как это было в прошлом), но если у вас установлено программное обеспечение, которое не учитывает откат таймера, это может привести к непредвиденным последствиям.
Тайлер
1
Вы имеете в виду этот Microsoft KB ?
Джскотт
9
Э-э, это ошибка NT 4 Win 2K + не страдают от этого. Я думаю, что мы можем с уверенностью сказать, что NT 4 умер в 2011 году. И если кто-то где-то запускает его ... они заслуживают того, что они получают в этот момент.
Zypher
2

Я имел обыкновение перезагружать все свои серверы Windows каждую неделю, и, безусловно, было время, когда это требовалось. В эти дни я перезапускаю их только тогда, когда это требуется для обновления. Конечно, это означает, что они все равно перезапускаются каждые несколько недель.

Джон Гарденье
источник
2

Microsoft проделала большую работу по улучшению своей серверной ОС за эти годы. Некоторые серверы могут работать в течение 6–12 месяцев, прежде чем они начнут испытывать проблемы, а некоторые - только через 2–3 месяца. Все зависит от того, какие сервисы и приложения работают на серверах. Но все они будут иметь проблемы в какой-то момент. Обновления Windows, утечки памяти, несовершенное программное обеспечение - это всего лишь несколько причин.

Для наших клиентов с контрактами на обслуживание мы устанавливаем обновления и ежемесячно перезагружаем их серверы. У этих клиентов гораздо меньше неприличных проблем с сервером, порядка 1/5 от числа проблем, которые не перезагружаются регулярно.

Для тех, кто говорит, что перезагрузка вызывает преждевременный аппаратный сбой, было время, когда перезагрузка жестких дисков и систем была потенциальной проблемой. Однако сегодня жесткие диски и другие компоненты рассчитаны на тысячи циклов запуска и остановки. Если ваше серверное оборудование слабое, вы бы предпочли знать об этом в контролируемое время, когда вы готовы быстро решить проблему, или в случае случайного сбоя с вызовом в середине рабочего дня с сообщением о том, что отдел не работает?

Я чувствую, что нет никаких недостатков в регулярных ежемесячных перезапусках, в то время как преимущества очевидны и проверены с течением времени.

Тодд Х
источник
1

Я полагаюсь на обновления Windows, чтобы настроить мое «расписание перезагрузки». Позвольте Windows управлять собой .. на этот раз! Только очень редко требуется перезагрузка с нашей установкой из-за утечек памяти ...

louisnorthmore
источник
1

Я сетевой администратор в компании, которая работает на нескольких серверах Windows 2003 2008. Я перезагружаю серверы ежемесячно, обычно не дожидаясь дольше 3 месяцев, так как очень важно не работать в течение этого короткого периода времени.

Однако с обновлениями и обновлениями Windows я буду устанавливать WSUS на контроллере домена, чтобы устанавливать обновления и т. Д. По расписанию, исходя из моих предпочтений. Это сделано для того, чтобы серверы не обновлялись и не перезагружались неожиданно ...

GMitch
источник
1

Всем вам, ненавистникам Windows, следует проверять сайты Netcraft.com с самыми длинными запущенными системами по среднему времени безотказной работы ( http://uptime.netcraft.com/up/today/top.avg.html ). Это показывает сайты, которые работали дольше всего с момента их последней перезагрузки, и 95% из 50 лучших - машины с Windows 2003 и 2000 Как всегда, ваш пробег может отличаться.

Марк Лоуренс
источник
Возможно, вы не слишком много знаете о балансировке нагрузки ...
mfinni
0

Определение только Windows может быть слишком широким для принятия разумного решения. Фактически, вы примете более правильное решение, если рассмотрите службы, роли и функции, которые вы запускаете на компьютере с Windows (например, веб-службы, серверы баз данных и т. Д.).

Качество и поведение сторонних приложений и веб-сервисов, запущенных на конкретном сервере, может указывать на необходимость более / менее частого перезапуска хост-компьютера Windows, чем на других машинах без них.

На самом деле некоторые сторонние приложения ( не идеально разработанные; ну, конечно, никто не идеален! ) Могут не выпустить израсходованные системные ресурсы, такие как память, блокировки и сокеты, изящно и своевременно. Это, например, может удерживать некоторые сбойные приложения, службы или драйверы [при повторном запуске ] в состоянии ожидания или в начальном состоянии, которые нельзя легко исправить без перезагрузки.

На практике приложения, работающие с дисковым вводом-выводом, сетью и памятью при высокой и загруженной рабочей нагрузке и с низкими доступными системными ресурсами, могут привести к зависанию, нестабильности или перегрузке вашей машины Windows, что может привести к ее перезапуску.

Если вам приходится запускать такие неисправные приложения или обслуживать больше пользователей, чем типичная емкость вашего аппаратного / программного обеспечения, или вы вынуждены размещать несовместимые службы на одной физической машине, вы можете прийти к такому решению, что вам следует перезагрузить Windows периодически. В этом случае вы можете настроить период перезапуска, прослушивая жалобы пользователей на скорость сервера!

FIV
источник
-6

Правильный ответ никогда не будет, если вы не обновите программное обеспечение. В последний раз я перезагружал свой сервер около 2 лет назад, и причина была в сбое питания.

Дмитрий Р
источник
3
Я надеюсь, что вы либо говорите о сервере Linux, либо я надеюсь, что ваш сервер не используется профессионально ...
HTDutchy
3
Каждый сервер, который был исправлен, должен быть перезапущен, чтобы применить некоторые из этих исправлений. Любой сервер, который открыт для публичной сети, должен быть исправлен.
Railmaat
У меня есть пара контроллеров домена NT 4, которые загружаются примерно раз в год. Больше никаких обновлений, больше не предназначенных для плохих парней ... (они не выходят в интернет)
hsmiths