Диск ReFS / дискового пространства сбрасывается при большой нагрузке

8

У меня есть рабочая станция Windows 10, используемая в моем бизнесе для таких вещей, как обработка изображений (Photoshop) и разработка программного обеспечения (Eclipse). Это компьютер на базе i7-2600K, материнская плата Gigabyte GA-B75M-D3H B75, 16 ГБ оперативной памяти. Операционная система установлена ​​на Samsung 850 pro SSD, есть еще 850 pro для данных, WD Black для данных, а также два накопителя HGST по 4 ГБ каждый на портах SATA 3, отформатированные ReFS, в зеркале дискового пространства. В массиве используется 1.63GB, 1.99GB свободно.

Недавно диски ReFS в зеркале дискового пространства начали сбрасываться - до сих пор три раза в месяц. Это обычно происходит при умеренной или тяжелой нагрузке, после длительного периода. Насколько я могу судить, ни один из других дисков не падает под нагрузкой, поэтому я предполагаю, что это ReFS, дисковые пространства или проблема с основным диском. Перезагрузка переводит диск в оперативный режим.

Я вижу ошибки в средстве просмотра событий, такие как приведенные ниже. Они не все в одном месте, и, хотя в разделе «Журнал приложений и служб -> Microsoft -> Windows» есть области журналов NTFS и Storage Spaces, похоже, что для ReFS их нет.

Я был бы признателен за помощь в выявлении причин этих проблем и их устранении, чтобы моя система работала.

16:27.05 (under event viewer -> application and services log -> microsoft -> windows -> storagespaces-driver-operationsl
Virtual disk {26bf58b3-1cb9-4b93-a945-1b89331bb565} requires a data integrity scan.                                    
Data on the disk is out-of-sync and a data integrity scan is required.                  To start the scan, run the following command:                  

Get-ScheduledTask -TaskName "Data Integrity Scan for Crash Recovery" | Start-ScheduledTask                  

Once you have resolved the condition listed above, you can online the disk by using the following commands in PowerShell:                  

Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Get-Disk | Set-Disk -IsReadOnly $false                  
Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Get-Disk | Set-Disk -IsOffline  $false

16:27.05 (windows system event log): The file system was unable to write metadata to the media backing volume R:. A write failed with status "A device which does not exist was specified." ReFS will take the volume offline. It may be mounted again automatically.
16:27.06 (windows system event log): The file system detected a checksum error and was not able to correct it. The name of the file or folder is "<unable to determine file name>".
18:35.50 (windows system event log): Failed to connect to the driver: (-2147024894) The system cannot find the file specified. 
18:35.50 (Kernel PNP) The driver \Driver\WudfRd failed to load for the device SWD\WPDBUSENUM\_??_USBSTOR#Disk&Ven_Generic&Prod_STORAGE_DEVICE&Rev_9451#7&2a9fd895&0#{53f56307-b6bf-11d0-94f2-00a0c91efb8b}.

18:35.58: Virtual disk {26bf58b3-1cb9-4b93-a945-1b89331bb565} could not be repaired because there is not enough free space in the storage pool.                  
Replace any failed or disconnected physical disks. The virtual disk will then be repaired automatically or you can repair it by running this command in PowerShell:                  
Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Repair-VirtualDisk

ОБНОВЛЕНИЕ, поскольку yagmoth указывает, что эта ошибка включает кое-что о USB. Сценарии, в которых я вспоминаю эту ошибку: а) при резервном копировании на внешний USB-диск; б) при выполнении резервного копирования CrashPlan на другой внутренний диск SATA.

Тим
источник
1
антивирус удален в случае, если проблема совместимости с Windows 10? как у mcafee возникли проблемы с юбилейным обновлением
yagmoth555
@ yagmoth555 Полагаю, я мог бы попробовать, но мне это не кажется невероятным. Я весьма заинтересован в том, как решить проблему самостоятельно, а не угадывать и проверять.
Тим
К сожалению, без большего количества журнала я подозреваю, что под аппаратной проблемой. Поскольку идея AV была простым тестом, как если бы ваше зеркало не могло справиться с IO, AV-драйвер при доступе / при записи не помогает (поскольку он замедляет ваш IO, устанавливая драйвер между ними). ​​Если вы хотите исследовать без теста / ошибки, вы мог бы сначала попробовать обработчик процессов для регистрации всего. Если все не получится, я попытаюсь удалить зеркалирование для проверки снова после этого (но, к сожалению, этот тест все еще является тестом / тестом на ошибки). Держите нас в курсе с журналом мониторинга, пожалуйста
yagmoth555
Могу ли я спросить, если ваше зеркало сделано с USB-диска? в качестве ошибки ядра указывается драйвер usb
yagmoth555
Оба диска находятся на SATA 3Gbps. Хорошая информация об ошибке USB. Вопрос обновлен. Я не нахожусь в машине в течение недели или около того, но я попытаюсь вызвать это снова и видеть, отличаются ли журналы. Похоже, что ProcessMonitor будет генерировать массу журналов, но я попробую, когда-нибудь, спасибо.
Тим

Ответы:

2

Пространство памяти кажется очень чувствительным к задержке записи: если оно слишком велико, объем может быть отброшен.

Это кажется известной проблемой при использовании потребительских твердотельных накопителей, как вы можете найти здесь

shodanshok
источник
Спасибо за эту информацию. Мои диски ReFS / Storage Space представляют собой жесткие диски HGST емкостью 4 ТБ, а не твердотельные накопители. Мои SSD работают под управлением NTFS. Впрочем, интересна задержка записи.
Тим
1

Во-первых, вы действительно должны проверить HCL. Могу поспорить, что ужин получился довольно приятным, ничего такого, о чем вы упомянули, нет в Storage Spaces HCL Как и vSAN, Windows и Storage Spaces имеют совершенно разные HCL. Даже не глядя на ваши диски, я могу сказать, что ни один из них не будет включен в HCL, потому что ни один из них не является диском корпоративного уровня.

Если вам нужно стабильное решение, приобретите карту LSI SAS (не RAID), приобретите корпоративные жесткие диски SATA и получите твердотельный накопитель Intel серии DC. Это дорого? Ага. Будет ли это надежным? Столько, сколько может быть Windows, когда дело доходит до хранилища (что не очень хорошо).

Я сбросил объем памяти и вернулся к карте LSI RAID. Еженедельно избавлялся от повреждения данных, чтобы более двух лет работать на одном и том же оборудовании. И у меня был ВСЕ комплект корпоративного класса, который был на HCL.

Список совместимости оборудования (HCL) можно найти здесь https://www.windowsservercatalog.com/results.aspx?&chtext=&cstext=&csttext=&chbtext=&bCatID=1642&cpID=0&avc=10&ava=0&avq=0&OR=1&PGS=25

Эрик С. Сингер
источник
1
Спасибо за твои мысли, Эрик. Возможно, вы могли бы отредактировать свой пост, чтобы расширить «HCL», так как я не знаю, что это значит, и никто не будет читать этот пост. Я думал, что весь смысл программного RAID, такого как пространство хранения, состоит в том, чтобы избежать необходимости в дорогих решениях корпоративного уровня. Я не уверен, что твой ответ «выброси и купи что-нибудь другое» действительно отвечает моему вопросу.
Тим
Смотрите мои комментарии, HCL = оборудование, которое сертифицировано для работы с точки зрения непрофессионала. SW RAID не означает и не означает, что вы можете экономить на HW корпоративного уровня, это означает, что у вас есть гибкость решения на основе SW.
Эрик С. Сингер,
... и прекратите использовать ReFS, переключитесь обратно на NTFS. это как бесконечно более зрелый, чем ReFS. У ReFS много обещаний, но у нее есть масса зрелости.
Эрик С. Сингер,
Я написал целый пост в блоге о Storage Spaces BTW, начал серию, но разочаровался, потому что IMO - это POS. Как и большинство решений MS, он наполовину испечен. ericcsinger.com/backup-storage-part-5-realization-of-a-failure Мы вернулись к платам RAID и с тех пор у нас не возникло проблем. Поскольку вы используете зеркальное отображение, вам будет лучше настроить скрипт robocopy для копирования данных с одного диска на другой. Проще устранить неполадки и, возможно, более надежно, и это позволит вам сохранить ваши диски потребительского уровня.
Эрик С. Сингер,
1
Тем не менее, поскольку вы зеркалируете свои диски, вы можете удалить один диск, отформатировать его в NTFS и скопировать на него свои данные. Я настоятельно рекомендую не использовать места для хранения, поскольку проблема, с которой вы сталкиваетесь, не столько ReFS, сколько проблема с хранилищами. Все, что связано с извлечением или обнаружением дисков как сбойных, связано с областями хранения. Если вы просто пытаетесь синхронизировать диски, чтобы у вас была локальная реплика, robocopy - самый простой способ сделать это, просто не в реальном времени все.
Эрик С. Сингер