Нужно ли отключать серверы ночью?

144

Существует сервер, который используется с 4:30 утра до ~ 22:00.

Должен ли он быть выключен? Я думаю, что это сервер, и на нем не будет проблем, но серьезные профессора говорят мне, что это опасно и что HD может выйти из строя в течение 2 лет. Владелец сервера полагает, что его старый сервер, работающий с 1995 года без резервного копирования и одного жесткого диска (если жесткий диск выходит из строя, он завинчивается) не имел проблем, потому что он выключал его по ночам.

Во что ты веришь за это?

Теперь он имеет массив RAID 1, резервное копирование на внешний жесткий диск и несколько полных резервных копий на DVD и через Интернет.

GorillaApe
источник
62
+1, потому что, хотя это вопрос, о котором я не думаю, что кто-либо из нас когда-либо даже развлек мысль, ясно, что некоторые люди делают, и на это нужно ответить.
Марк Хендерсон
8
Ваши профессора не работают серверы. Они работают на рабочих станциях с сетевыми демонами.
Бекон Бит
4
Разве вы не можете использовать некоторые настройки питания, чтобы раскрутить жесткие диски, когда они не используются? То же самое с точки зрения износа, но вам не нужно выключать всю машину.
Брендан Лонг
34
Профессора английского языка Lit?
Iain Holder
28
Я бы не рекомендовал принимать советы от людей, не делающих резервных копий. Особенно нет, если они делают это в течение 15+ лет. Экономия электроэнергии - единственный аргумент в пользу ее отключения. Срок службы будет сокращаться из-за нагрева и охлаждения каждый день.
Malte

Ответы:

153

Чтобы сравнить это с автомобильной аналогией: такси может пройти более 500 000 километров, прежде чем оно нуждается в восстановлении двигателя. Причина этого заключается в том, что они всегда работают круглосуточно, и после того, как двигатель автомобиля прогрелся, уровень износа, который он получает во время работы, значительно снижается.

Компьютер вроде тот же. Большая часть «износа» деталей может произойти при загрузке сервера. Просто подключите амперметр к вашему компьютеру и включите его. Когда он запускается, потребляемая мощность поднимается очень высоко, а затем успокаивается, когда все диски раскручиваются и процессор запускается. Кроме того, подумайте, сколько дисковой активности сервер испытывает во время загрузки по сравнению с тем, когда он работает. Скорее всего, доступ к диску при загрузке ОС является довольно надежным делом, тогда как при работе ОС, если только это не очень тяжелый сервер базы данных (я полагаю, нет), диски, скорее всего, будут довольно простаивать. Если когда-нибудь произойдет сбой, скорее всего, это произойдет при загрузке.

Включение и выключение вашего сервера - глупая идея. Не говоря уже о том, что большинству серверов может потребоваться от 2 до 5 минут, чтобы просто пройти проверки BIOS, это также огромное количество потерянного времени.


Обновление 2018 года: учитывая, что большинство компьютеров теперь в основном полностью твердотельные, этот ответ может быть не таким точным, как когда-то. Аналогия с такси не очень подходит для современных современных серверов. Тем не менее, обычно вы все еще не выключаете серверы.

Марк Хендерсон
источник
15
Не могли бы вы добавить ссылки на исследования по этой теме?
Мафу
15
@mafutrct: WikiBook о сбое HD и исследование лаборатории Google о сбое HD показывает неопровержимые доказательства того, что циклы питания влияют на срок службы диска, а общее время безотказной работы не так много, как партия / удача розыгрыша. Также очевидные вещи, такие как физическая травма, оказывают наибольшее влияние.
Крис С
3
Как они заправляют такси, если оно всегда работает? Это незаконно в большинстве юрисдикций.
Гонки легкости на орбите
8
@Tomalak - хорошо, суть аналогии была в том, что двигатель Такси нагревается и в течение этого времени происходит меньший износ. За 90 секунд, необходимых для заправки такси, у двигателя нет шансов остыть, и, таким образом, износ все еще уменьшается. На компьютере он «охлаждается» (в целях аналогии) мгновенно, и каждый запуск - это «холодный» запуск.
Марк Хендерсон
6
@Fergus - ну, это касается только физических боксов. Если у вас есть виртуальная машина, вы можете включать и выключать ее сколько угодно. Но вы не получите от этого никакого спасения или экономии энергии.
Марк Хендерсон
70

Выключение и повторное включение сервера может привести к его быстрому отказу, а не к включению.

биты хоста
источник
3
Скорее всего из-за нагрузки на диск @ boot; Кроме того, у меня был сервер, который успешно работал в течение многих лет, а затем отказался при перезагрузке. Оказывается, загрузочный диск медленно деградировал, MBR полностью не читался, но MBR читался только при загрузке, так что никто не заметил. К счастью, диск полностью умер только после безумной попытки восстановить то, что еще не было скопировано.
Писквор
Я сомневаюсь, что это происходит при отключении один раз в день, даже на корпоративных дисках в технических деталях указано 300 000 переключателей. Проблема исходит от управления энергопотреблением, которое делает это каждые 15 минут.
Лотар
Я не понимаю, как ответ, в котором говорится только о чьих-то мыслях, без каких-либо рассуждений о том, что когда-либо получало 70 голосов.
Bassie-c
52

Единственное, что я могу видеть в том, что вам сказали, это даже близко к праву, что диски могут выйти из строя в течение 2 лет. Они могут фактически потерпеть неудачу в любое время. Я уверен, что большинство из нас получили по крайней мере один новый диск, который был DOA. В среднем срок службы серверных дисков составляет от 3 лет и более, причем 10 или 20 лет не являются чем-то необычным. Это не значит, что какой-то отдельный диск не скоро выйдет из строя.

Серверы (имеется в виду машина с надлежащими компонентами класса сервера) предназначены для непрерывной работы. Нет причин выключать его ночью, но есть несколько веских причин, чтобы он работал. Ночное время, или какое-либо другое время является «тихим» для данной системы, - это время для запуска всего технического обслуживания и автоматизации.

Например, резервные копии лучше всего делать, когда нет активности пользователя. Это помогает обеспечить согласованность резервных копий. Конечно, есть способы обойти это, но почему бы не дать вашим резервным копиям все шансы на успех, когда от этого нечего терять?

Кто-то работает на «сервере» с одним диском и без резервной копии - дурак, а не администратор. Единственная причина, по которой ему это сошло с рук, это просто глупая удача. Это не имело абсолютно никакого отношения к выключению машины ночью.

Джон Гарденье
источник
Здесь я сделаю дикое предположение и скажу, что «администратор», который не выполняет резервное копирование, также не использует надлежащие компоненты серверного уровня.
интуитивно
23

Серверы предназначены для работы 24x7. Выключение серверов на ночь крайне нетипично. Серверные жесткие диски спроектированы так, чтобы быть более надежными, чем настольные диски, и теперь, когда у вас есть резервные копии и RAID 1, вы не будете страдать от потери данных в случае отказа одного из двух ваших дисков.

То, о чем я бы беспокоился сейчас, для этого 16-летнего сервера, это сбой материнской платы или источника питания без резервирования.

Нулевая подсеть
источник
Это кажется логичным :) Это ПК Motorola Power еще не умер!
GorillaApe
13

Я никогда не выключал сервер ночью.

Жесткие диски выйдут из строя, когда они собираются выйти из строя. Включение и выключение машины не приведет к замедлению сбоя привода. Я видел отгруженные жесткие диски от производителя, и я видел диски, работающие (и активно используемые) более 5 лет без сбоев.

Ваши профессора идиоты.

mrdenny
источник
2
Включение и выключение машины, безусловно, приведет к более медленному отказу привода, если он останавливается на достаточно длительный период времени. Если вы выключите машину на 10 лет, то более или менее гарантированно прослужит приводу не менее 10 лет. Вопрос в том, как долго нужно останавливать среднюю машину, чтобы иметь положительный эффект.
интуитивно
4
@intuited Если после 50 лет ожидания вы включаете машину, а привод не загружается, она длилась 0 лет, 50 лет или как?
Кейд Ру
@Cade Roux: Понятия не имею. Что это значит? Даже если мы посчитаем это как 0, этот выброс не собирается существенно изменить общее среднее значение.
интуитивно
1
@intuited это была шутка - но на самом деле, она, скорее всего, искажет среднее значение research.google.com/archive/disk_failures.pdf. Исходя из этих данных, вполне возможно, что новый диск, включенный после того, как он отсиживается на полке до 5 лет, будет более вероятен сбой, чем накопитель, работающий в течение 5 лет. Дело в том , спорный вопрос , потому что он не окупится , чтобы аппаратные простаивать больше , чем это делает , чтобы его выключить и снова включить . Аппаратное обеспечение ухудшается и устаревает, и его максимальное значение необходимо использовать до того, как оно изнашивается и заменяется.
Кейд Ру
@Cade Roux: Из исследований Google, на которые вы ссылались: Как это обычно бывает при развертываниях серверного класса, диски были включены, вращались и, как правило, работали практически всю свою записанную жизнь. Так что исследования здесь не актуальны. Это действительно показывает, что все еще новый накопитель с большей вероятностью выйдет из строя, чем старый, в течение заданного периода времени после его повторного включения, но это предполагает, что старый накопитель еще не вышел из строя в течение 5 лет, в течение которых он был Бег.
интуитивно
11

Это также помещает больший «человеческий аспект» на сервер. Даже если вы используете настройки электропитания, чтобы выключать и включать его в нужное время, вам нужно, чтобы кто-то наблюдал за сервером, чтобы убедиться, что все необходимые службы и т. Д. Запускаются правильно. Это драгоценное время, которое вы можете преподавать профессорам о резервном копировании и RAID.

Когда вы запускаете резервные копии? Я бы дал что-нибудь за 6-часовое окно для запуска моих ежедневных резервных копий, обновлений, исправлений и т. Д. Если ничего другого, это время простоя может быть использовано для этого.

Я призываю вас пойти к этим «серьезным профессорам» и провести исследование, показывающее, что оставлять компьютер в режиме 24x7 вредно для него. Я хотел бы подтвердить то, что они говорят.

Тео
источник
Я сказал серьезно, потому что один из них разработал процессоры, встроенные системы очень хорошо знают ядро ​​Linux. Что касается резервных копий, я сделал сценарии для автоматического резервного копирования, но затем владелец и администратор выглядели как WTF чувак. "НЕТ, я хочу делать их вручную ежедневно", а не "смолить и сжать их".
GorillaApe
2
@Parhs Проще говоря, вы умнее своих начальников. Было бы мудро с вашей стороны уйти и найти настоящего наставника, прежде чем вы проведете слишком много времени в тени идиотов, которые не позволят вам поступить правильно.
Skyhawk
10

Реально, как ожидается, большинство серверов будут доступны 24/7. Легко и просто.

Вероятность того, что у вас нет, очень много споров, которые приведут к увеличению износа вашего сервера, постоянному расширению и сокращению между включением вашего сервера и его нагревом, а затем выключением и охлаждением. или износ компонентов от постоянного использования.

Я еще не видел ни одного исследования, которое хуже, и я очень сомневаюсь, что у вашего профессора есть доступ к некоторым исследованиям, утверждающим по-другому.

В конце концов, вам придется принимать решение исходя из своих потребностей, но экономическая выгода для большинства компаний заключается в том, чтобы их серверы и службы были доступны постоянно, а не только тогда, когда кто-то входит и включает их. Особенно, когда есть спор, что на самом деле вы можете создавать больше проблем для своих серверов, отключая их.

rfelsburg
источник
7

Что более важно, так это охлаждение. Охлаждение имеет большое значение. Температура внутри коробки может быть намного выше, чем в помещении. Я бы установил программное обеспечение для мониторинга, как Everest. Сравнивая современные жесткие диски с теми, которые вы заменили, они сильно нагреваются. Некоторые нуждаются в поклонниках, чтобы охладить их. Иногда маленький поклонник может иметь большое значение. Срок службы HD и сервера будет зависеть от охлаждения.

Джо в Мичигане
источник
5

Да не вариант. Скажите своим преподавателям, что отраслевой стандарт - оставить их работающими круглосуточно и иметь гарантию на неисправное оборудование. Если серверу 16 лет, я думаю, вы не получите эту гарантию.
Если сервер взорвался, какое время восстановления вам понадобилось бы, чтобы создать новый с резервной информацией? Я бы начал намекать клиентам, что их сервер закончил работу, и они должны начать искать средства для нового.

xXhRQ8sD2L7Z
источник
5

Это правда, что механические нагрузки при отключении питания сильно сказываются на жестком диске. Кроме того, были некоторые старые диски, которые (при достаточном охлаждении) могли вообще перестать работать из-за «зависания».

При неправильно разработанных схемах пусковые токи при включении машины могут также вызвать нагрузку на некоторые компоненты, хотя это не так уж вероятно.

Тем не менее, есть некоторая истина, что оставление машины включается: конденсаторы. Многочисленные электролитические конденсаторы на материнской плате, вероятно, являются самым слабым звеном надежности системы. Эти конденсаторы рассчитаны на их способность обрабатывать ток / напряжение, рабочую температуру и срок службы. Типичные конденсаторы рассчитаны на несколько тысяч часов. Сверхмощные / долговечные колпачки рассчитаны на несколько десятков тысяч часов и более высокие температуры.

Вот почему вы иногда видите в продаже материнские платы с «конденсаторами серверного уровня» - потому что эти машины работают на полной скорости 24x7 и прожирают их срок службы материнской платы.

Toybuilder
источник
15 с лишним лет назад я слышал термин «статистика диска» или что-то в этом роде. Объяснение было дано после нескольких лет эксплуатации, когда полимеры в смазочных материалах для дисков начинают образовывать длинные цепи, а когда диск отключается и перестает вращать подшипники захватить и не начнется снова ». Сбои питания в DC обычно означали, что группа серверов не будет перезагружаться. Конечно, я понятия не имею, какие диски сейчас используют в качестве / вместо подшипников.
JQA
+1 за ограничение. Мне было интересно, если кто-нибудь упомянет об этом. @james, это называется «трения», и было проделано много работы, чтобы найти смазочные материалы для приводов, которые не уплотняются со временем, используют / злоупотребляют. Все лучше, чем было раньше, но включение и выключение приводов по-прежнему не очень хорошая идея, потому что они, скорее всего, умрут при попадании питания, либо из-за того, что какой-то компонент перегорел, либо двигатели привода не могут начать вращать пластины.
Грег
Большинство материнских плат, выпущенных в 2008 году (возможно, раньше), теперь используют твердотельные конденсаторы, которые НАМНОГО более долговечны, чем электролитические компоненты. Источники питания теперь являются единственным местом, где вы все еще видите электролитические конденсаторы.
Мирча Chirea
Это хитрость (трость + трение), а не трение. :-)
любезно
2

Когда у меня был сервер, получавший ежемесячное профилактическое обслуживание от производителя, они начинали с выключения каждый месяц. Это приводило к сбоям компонентов. Расписание изменилось на ежеквартальный, а затем только в случае необходимости. Я бы не рекомендовал выключать такую ​​старую систему, если в этом не было необходимости.

BillThor
источник
Да, я видел серверы с временем работы более 1000 дней. Но не регулярная перезагрузка (тёплая) - это грех; Лучше столкнуться с неисправной системой после плановой перезагрузки, чем после незапланированной. Также эти перезагрузки имеют тенденцию обнаруживать ошибки конфигурации.
sjas
1

Одна вещь, не упомянутая, состоит в том, что у большинства серверов есть задачи обслуживания, которые они выполняют ежедневно, еженедельно или ежемесячно. Они почти всегда запланированы на середину ночи, когда ожидается, что активность будет самой низкой.

Например, в системе Red Hat эти действия начинаются в 4:02 по времени сервера. В зависимости от сервера они могут работать от нескольких секунд до часа и более. Если вы включите сервер в 4:30, эти задачи по обслуживанию начнутся немедленно (анакроном), и самые ранние пользователи, которые войдут в систему в период между этим периодом и 5 часами утра, будут в некоторой степени затронуты.

Майкл Хэмптон
источник