Почему контроллер домена должен выполнить откат USN после нечистого завершения работы?

8

У меня есть этот контроллер домена Windows Server 2008 R2, работающий на физическом сервере Dell, модель PowerEdge R510.

Здесь есть некоторые проблемы с электричеством, поэтому отключение, к сожалению, является довольно распространенным явлением; Есть ИБП, но они не настолько надежны, как должны быть, и иногда серверы будут испытывать нечистые отключения.

По какой-то причине я действительно не могу понять, иногда этот конкретный контроллер домена появляется после нечистого отключения и сталкивается с откатом USN , что вынуждает нас понижать и продвигать его обратно.

Это вообще не имеет смысла, так как сервер является физическим, и на нем никогда не выполнялись снимки, клонирование и / или восстановление; кроме того, на нем не установлено никакого дополнительного программного обеспечения, оно выполняет только функции постоянного тока; в частности, нет клонирования / восстановления / какого-либо программного обеспечения.

Повреждение файловой системы, по крайней мере, имело бы какой-то смысл, но откат USN на самом деле этого не делает, поскольку невозможно вернуть сервер в предыдущее состояние. Тем не менее, это происходило как минимум три раза за последние два месяца, так что это определенно не было одноразовым сумасшедшим событием; но я совершенно не могу придумать объяснения.

В чем может быть причина этой проблемы?

Massimo
источник
3
Как именно вы определили, что это был откат USN?
Матиас Р. Джессен
HKLM\System\CurrentControlSet\Services\NTDS\Parameters\DSA not writable= 4
Массимо
Очень хороший вопрос Я думал об этом уже пару часов. Я до сих пор не знаю. Но, кстати, поскольку вы ожидаете, что сервер будет часто испытывать перебои в подаче электроэнергии, подтвердили ли вы, что кэширование записи по-прежнему отключено на всех томах? Я знаю, что по умолчанию вы используете dcpromo, но его можно переопределить. Просто хочу убедиться, что вы не включили кеширование записи обратно.
Райан Райс
Хорошее предположение о записи кэширования. Помимо системного кэша, на сервере есть аппаратный RAID-контроллер, поэтому это тоже нужно проверить. Завтра посмотрю.
Массимо

Ответы:

6

Я думал об этом сегодня несколько часов. Это немного сбивает с толку, но, как я указал в своем комментарии, я думаю, что у вас либо происходит какое-то кэширование диска, которое не фиксируется на диске до того, как отключение питания / грязное завершение работы уничтожило содержимое кэша. ... Или, поскольку вы работаете на томе RAID, в котором находится файл ntds.dit, из-за сбоя питания ваш том RAID может временно прерваться или стать непоследовательным, даже на мгновение.

Мы знаем, что партийная линия при откате USN - это когда контроллер домена восстанавливается в состояние, как это было раньше, классическим примером является восстановление виртуализированного контроллера домена из снимка. Я знаю, что это не относится к вам точно ... но даже в случае диска с кэшем записи, вы можете думать о данных, которые физически находятся на диске, как содержащие «предыдущее состояние», в то время как кэш записи это то, что на самом деле содержит самое современное состояние DC ... даже если два состояния разнесены всего на полсекунды.

Обдумайте эти комментарии от Microsoft:

Рекомендации для виртуализированных контроллеров домена

Виртуальные диски SCSI обеспечивают повышенную производительность по сравнению с виртуальной средой IDE и поддерживают принудительный доступ к единице (FUA). FUA гарантирует, что операционная система записывает и считывает данные непосредственно с носителя, минуя все механизмы кэширования.

Я знаю, что ваш DC не является виртуальной машиной, но концепция все еще применима. Кэширование диска и контроллеры домена не смешиваются. Вот почему установка Active Directory отключает кэширование записи как политику Windows, но в вашем аппаратном RAID-контроллере все еще могут быть механизмы кэширования и т. Д.

Сценарий Б. Запуск Active Directory с других дисков в разбитом зеркале

  1. Продвигать контроллер домена. Найдите файл Ntds.dit на зеркальном диске.

  2. Разбей зеркало.

  3. Перейдите к входящей репликации и исходящей репликации, используя файл Ntds.dit на первом диске в зеркале.

  4. Запустите контроллер домена с помощью файла Ntds.dit на втором диске в зеркале.

Это убийца репликации, который сильно укусил меня на физических контроллерах с томами RAID 1. У меня никогда не было реального отката USN, вызванного этим, но это убьет репликацию на этом контроллере домена. Я имею в виду, представьте RAID 1 том 2 диска. 1 диск умирает. Вы удалите его, вставьте новый диск ... aaaaaa и DSA Not Writable.

Из блога AskDS :

Если у вас нет источников бесперебойного питания (ИБП) для хостов виртуальных машин или диска хранения, на котором находится база данных активного каталога, убедитесь, что кэширование записи отключено на хост-компьютере виртуальной машины. Пожалуйста, обратитесь по этой ссылке для получения дополнительных указаний. И наоборот, если кэширование записи должно оставаться включенным для хоста виртуальной машины, на котором размещается DC, то установите ИБП, чтобы избежать повреждения DC (s).

Опять же, речь идет о виртуализированных DC, но концепция кэширования диска применима и к физическим DC.

Вот и моя идея. Я думаю, что это как-то связано с вашей системой хранения. Определенно хотите отключить все механизмы кэширования, по крайней мере, на томе ntds.dit, особенно если вы склонны к перебоям питания.

Райан Райс
источник
2
Именно мои мысли. Кэш записи на адаптере массива, но не на батарейках. Поставил бы на него 0,05 фунта стерлингов :-)
Саймон Кэтлин
1
Кэш записи был фактически включен на RAID-контроллере, и ОС не смогла автоматически отключить его; Я вручную отключил его, и я надеюсь, что это решило проблему раз и навсегда. Эта конфигурация, скорее всего, была его основной причиной.
Массимо
Ницца! Это должно держать вас, пока вы не можете лучше UPS! ;)
Райан Райс
Подтверждено: проблема больше не возникала после отключения кэша записи (без батарейного питания) на контроллере физического диска.
Массимо
@Massimo Мне нравится, что ты вернулся, чтобы подтвердить это через 4 года. :)
Райан Райс