Здесь у нас есть несколько серверов, и почти каждый из них имеет выделенный ИБП. Между ними есть зависимости, поэтому они должны быть включены в правильной последовательности. В конечном итоге у нас возникают серьезные проблемы с источником питания, поэтому серверы выключаются, а затем перезапускаются в случайном порядке при восстановлении питания. Это не проблема, если серверы были отключены во время отключения электроэнергии, важно, чтобы они работали правильно без какого-либо вмешательства человека после восстановления питания.
Наши ИБП довольно дешевы, и единственный полезный для меня параметр конфигурации - это power the load xx seconds after power is restored
. Теоретически, устанавливая правильные задержки на каждом ИБП, я могу исправить порядок перезапуска сервера, но я не верю, что ИБП будет работать так, как ожидалось.
Это правильный путь?
Предоставляют ли ИБП высокого уровня другие возможности для исправления последовательности перезапуска?
Последнее замечание: мои взлеты находятся в диапазоне 1000 - 2200 ВА
systemd
- возможность определять правильные зависимости в процессе запуска. Подождите, пока служба X станет доступной, прежде чем пытаться запустить службу Y.systemd
экземпляром, а не для служб, работающих на совершенно разных серверах ...Ответы:
Стандартный ответ на это «совсем нет». Исправьте программное обеспечение для обработки перезапусков в случайном порядке. Если вам действительно нужны НЕКОТОРЫЕ серверы для запуска вначале (например, Active Directory), поместите их на USV, которые, возможно, дольше сохраняют LOT. Сервер на базе атома с низким энергопотреблением достаточно хорош в качестве контроллера Active Directory и может прожить целый день на небольшом USV.
Нет. Я бы сказал, что обычно предполагается, что программисты достаточно компетентны, чтобы правильно обойти эту проблему.
Что вы могли бы сделать, это:
Я бы сказал, что этот тип установки гораздо более распространен. Я бы назвал любое программное обеспечение, которое ТРЕБУЕТ сервер запускается в определенном порядке (вне чистой инфраструктуры), как сломанное и непригодное для бизнеса.
Точно так же, как примечание: наша собственная установка - это недорогая USV 20 кВ (низкая стоимость, потому что мы ее использовали) для серверов с ведомой USV 2000VA для машины, служащей «корнем» сети (и машины для резервного копирования). Подчиненный означает, что USV отстает от большого - поэтому он переключается на батарею только тогда, когда большой (который длится от получаса до 8 часов в зависимости от того, сколько нашей вычислительной сети находится в сети) переходит в отключение терминала.
источник
Блоки распределения управляемой мощности (а не ИБП) часто поддерживают индивидуальные задержки при включении отдельных розеток после возобновления питания.
Как правило, это предотвращает срабатывание автоматических выключателей, когда шкаф, полный систем, включается одновременно с восстановлением питания, но это также может быть использовано для сохранения порядка загрузки системных зависимостей.
источник
У меня была именно эта проблема. Единственное отличие заключается в том, что мы инвестировали в прочные блоки питания APC (например, APC SmartUPS 3000 ). С помощью программного обеспечения APC PowerChute для выключения сети ( PowerChute Network Shutdown) я могу выключать и запускать серверы в определенном порядке. Еще одна удобная функция программного обеспечения - настройка серверов на отключение в самую последнюю минуту, т. Е. Вычисление того, сколько энергии батареи оставили блоки APC, и отключение серверов с достаточным количеством времени для их правильного отключения вместо простого выключения.
Программное обеспечение ... не дружественное к пользователю, но в этом нет ничего сложного, если вы потратите время на его выяснение. Если вы заинтересованы в том, чтобы больше инвестировать в свою инфраструктуру, это, безусловно, путь.
источник
Похоже, что блоки ИБП являются недорогими и не могут быть настроены на определенное время ожидания выхода после восстановления питания (некоторые блоки более высокого уровня). Чтобы получить ту же функциональность, вам нужно выбрать конкретный хост, чтобы он всегда включался сразу (возможно, какой системе разрешено загружаться в любое время) и оставить все остальные серверы в выключенном состоянии (настроено в BIOS для возврата к питанию). Выключен при подаче переменного тока и для того, чтобы почтить магический пакет Wake On Lan и включить его, когда будет сказано сделать это) Затем на главном хосте, который выполняет загрузку, запустите скрипт / утилиту для определения времени передачи магического пакета WOL каждому хосту.
источник