Этот сервер vCenter был только что обновлен до версии 5.1 с обновлением 1. Я прохожу хосты и обновляю прошивку, а затем обновляю их с различных версий 5.0 до 5.1u1.
В vCenter 5.1u1, похоже, появилось интересное новое поведение: он выводит хосты из режима обслуживания, когда они переподключаются после отключения - но очень непоследовательно, я видел это, может быть, 4 или 5 раз при ~ 25-30 перезагрузках хоста. Я видел это только на 5.0 хостах, которые еще не были обновлены до 5.1.
В образе я перевел хост в режим обслуживания и перезагрузил его в режим автоматического обновления DVD-диска HP SPP. После обычного ~ 40-минутного процесса обновления хост вернулся в оперативный режим ... и за 7 секунд до того, как даже было зарегистрировано, что хост повторно подключился, vCenter отправил хосту задачу выйти из режима обслуживания.
Насколько я понимаю, vCenter единственное время, когда хост должен выходить из режима обслуживания, это когда vCenter переводит его в режим обслуживания (например, задачу обновления VUM).
Почему этот vCenter в одностороннем порядке выходит из хоста из режима обслуживания, инициированного пользователем?
Редактировать, дополнительная информация:
Я запустил обновления прошивки еще на 5 хостах одновременно. Двое из них вышли из режима обслуживания после повторного подключения, трое - нет. Общий фактор тех, кто выходит из режима обслуживания, кажется, как долго они были в автономном режиме ; два, которым потребовалось несколько попыток загрузки на виртуальный носитель, - это два, которые были выбиты из режима обслуживания.
- esx31 (изображение выше): 45 минут ответа
- esx19 (вышла из обслуживания): 87 минут без ответа
- esx24 (остался в обслуживании): 32 минуты без ответа
- esx29 (остался в покое): 39 минут без ответа
- esx32 (остался в обслуживании): 30 минут без ответа
- esx34 (вышла из обслуживания): 70 минут без ответа
Изменить: Идея времени отключения, кажется, была красная сельдь, поскольку это не происходит последовательно.
Кроме того , vpxd.log
похоже, что в режиме exit maint запуск задачи всегда следует сразу за этим vim.EnvironmentBrowser.queryProvisioningPolicy
вызовом SOAP. Вот линии, слегка обрезанные для ясности:
15:27:49.535 [info 'vpxdvpxdVmomi'] [ClientAdapterBase::InvokeOnSoap] Invoke done (esx31, vim.EnvironmentBrowser.queryProvisioningPolicy)
15:27:49.560 [info 'commonvpxLro'] [VpxLRO] -- BEGIN task -- esx31 -- HostSystem.exitMaintenanceMode --
Обратите внимание, что на узлах, которые не получают задачу выхода, vim.EnvironmentBrowser.queryProvisioningPolicy
событие все равно происходит. Я не вижу никаких других различий в событиях до или после этого в процессе переподключения, кроме дополнительных событий, вызванных выходом из режима обслуживания.
Учитывая упоминание в журнале политик инициализации, поиск проблем режима обслуживания, связанных с автоматическим развертыванием, вызывает жалобы на подобное поведение (хотя я вообще не использую автоматическое развертывание).
источник
Ответы:
Я видел это с хостами ESXi 4.1 после того, как патч случайно повредил папку / tmp / scratch. Возможно, вы захотите проверить, существует ли этот каталог на хостах, которые автоматически вышли из режима обслуживания.
Если они отсутствуют, вы захотите, чтобы mkdir создал его. Также вы можете проверить, правильно ли настроены постоянные царапины на каждом хосте, следуя этой статье VMware KB:
VMware KB: создание постоянного постоянного каталога для ESXi 4.x и 5.x
источник