Как сбросить SMART результаты

16

Как я могу сбросить результаты SMART, чтобы он не регистрировал предыдущие результаты. Моя причина в том, что я тестировал жесткие диски, закрытые вместе на закрытом корпусе. Это привело к тому, что один из жестких дисков не прошел показание температуры воздушного потока.

После вскрытия корпуса (который снизил темп всех дисков на 10 градусов Цельсия за 5 минут) и затем разделения дисков немного больше (на 3 градуса меньше) Все результаты были хорошими, но, поскольку в предыдущем чтении показание Airflow не удалось, оно всегда показывает как провал.

Итак, как я могу сбросить показания для SMART?

введите описание изображения здесь

Луис Альварадо
источник
1
Я думаю, что вы можете использовать Mhdd, чтобы отключить смарт, это с инструментами для гибких дисков на sysresccd.org/System-tools не лучшая идея ... но, возможно, стоит рассмотреть.
Матео
2
Почему вы хотите сбросить его?
Анджело
Ну, в основном это было 3 года назад, но я считаю, что это было потому, что в тот момент HDD находился в месте, где было ОЧЕНЬ много внешнего тепла. После перемещения его в комнату с более холодным климатом проблема все еще сохранялась, хотя температура поднялась с 68 градусов до 37 градусов. Таким образом, проблема заключалась в повышении температуры наружного воздуха, которое вначале создавало проблему, но все еще проявлялось после ее перемещения в другое место.
Луис Альварадо

Ответы:

0

Жесткие диски имеют свободное место для восстановления. Восстановление происходит автоматически. Инструменты восстановления только переназначают физически поврежденные сектора в это свободное место. После переназначения, когда чтение или запись происходят в поврежденном секторе, диск поворачивает доступ к свободному пространству и скрывает ошибку.

Честно говоря, я не знаю, как сбросить SMART-данные. Это то, что жесткий диск поддерживает внутренне, и в любом случае это было бы плохо.

SMART сообщает, что ваш жесткий диск выходит из строя! Сброс счетчиков не изменит того факта, что порог ошибки для диска был превышен.

Так что нет, вы не можете сбросить историю SMART. Он устанавливается на заводе для оценки привода при сбое. SMART можно только отключить или включить.

Надеюсь, это ответит на ваш вопрос.

Митч
источник
Привет Митч, ну как объяснил в вопросе, провал не реальный. Это было потому, что все жесткие диски были очень плотно закрыты в плохо проветриваемом помещении. После изменения и повторного тестирования он работал отлично, за исключением того, что он все еще упоминал о прошлом сбое. На данный момент я выполнил следующую команду sudo smartctl -l sataphy, reset / dev / sdd, которая решила проблему общего оценивания с учетом предыдущего сбоя, который теперь кажется нормальным, но сбой по-прежнему отображается для определенного атрибута. Снова, жесткий диск фактически не отказывает, но предыдущая ошибка все еще показывает.
Луис Альварадо
Я понимаю, но это может показаться нормальным, это только скрыто. Вы спросили, можно ли это сбросить, и ответ НЕТ. Даже если вы смогли скрыть ошибку, после того, как накопитель по какой-либо причине поступит к производителю, они могут выяснить, что со временем произошло с накопителем. Все, что я говорю, что предыдущая ошибка все еще показывает, и если вы не можете получить в руки инструменты, используемые производителями, для восстановления статуса SMART диска, он все равно будет отображаться.
Митч
26

На самом деле существует способ сброса данных SMART. Вам нужен только простой конвертер RS232 в USB (UART в TTL) и несколько кабелей, подключенных к диагностическим интерфейсам HDDS. (он находится на правой стороне порта sata, 5 или 4 контакта). Необходимо подключить кабели RX TX и GND (и, конечно, кабель питания: D), затем включить питание жесткого диска и подключиться к нему с помощью замазки или гипертерминала (linux может подключиться к собственный терминал, я думаю), например, для дисков Seagate: для 7200.10 и выше скорость передачи данных составляет 9600, для 7200.11 и выше - 38400

команды после подключения нажмите CTRL + Z, затем введите «/ 1», нажмите ввод, введите «N1», нажмите ввод, когда он закончит, удалите все кабели и включите жесткий диск, как обычно, чтобы увидеть изменения :)

для другой информации HDD использовать Google :)

MRX
источник
5
Кажется, это относится только к накопителям Seagate, но вы правы, это видео объясняет процесс.
Адриан Фрювирт,
5
Один из моих коллег связался с Seagate, и они сказали нам, что с тех пор заблокировали эту функцию, поэтому к ней нельзя получить доступ без проприетарного инструмента. Не уверен, в какой момент они это сделали.
JFA
4

Данные SMART не очень стандартны для разных производителей, но тест температуры жесткого диска должен показать, превысила ли температура накопителя ранее порог: http://en.wikipedia.org/wiki/SMART#Known_ATA_S.MART_attributes

Мысль заключается в том, что перегрев увеличивает ваши шансы на провал. SMART не говорит, что ваш диск неисправен, но в будущем у него больше шансов на сбой.

SMART предназначен для аудита истории накопителей и поддерживается самим накопителем, поэтому вы не можете «сбросить» или «очистить» значения SMART.

SlightlyCuban
источник
3

Точка текущих / наихудших атрибутов, таких как температура, как раз и заключается в следующем: сообщать вам, когда накопитель когда-либо находился за пределами своей максимальной рабочей температуры и, следовательно, мог получить постоянное повреждение.

Вот почему в нем говорится «провалился в прошлом», а не «провалился сейчас»: вы едва коснулись порога максимальной температуры. Обратите внимание, что на дисплее атрибута отображается «нормализовано: 50, порог: 45, худшее: 45». (Это нормализованные значения 0..200, как для любого другого атрибута, а не сырые температуры по Цельсию.)

У вас также есть несколько поврежденных секторов (неисправимые ошибки секторов), поэтому, независимо от того, из-за короткой высокой температуры это или нет, возможно, пришло время отключить этот диск.

Лучший пользовательский интерфейс программного обеспечения SMART покажет вам текущую и максимальную температуру . например,
smartctl -a /dev/sdaили smartctl -x /dev/sda( -xпечатает все доступные SMART и не SMART данные, которые он может получить от привода, включая журнал истории температур, если он есть, с гистограммой ASCII.)

Smartctl -x включает это для старого жесткого диска WD Green 1 ТБ (WD10EADS):

Current Temperature:                    36 Celsius
Power Cycle Min/Max Temperature:     25/42 Celsius
Lifetime    Min/Max Temperature:     35/46 Celsius

Программное обеспечение, которое вы используете, похоже, показывает только текущую температуру, которая немного ниже порогового значения, но не собирается скрывать тот факт, что накопитель был некондиционным в некоторый момент в прошлом.


Вы, безусловно, можете оправдать игнорирование этой кратковременной высокой температуры, если вы действительно исправили ее за считанные минуты. Но вы никогда не сможете (или не должны) заставить сам диск лгать о том, что он какое-то время превышал его номинальную максимальную температуру, и, таким образом, атрибут не удался в прошлом.

Вы можете настроить smartdигнорирование любого заданного атрибута, чтобы вы могли получать полезные уведомления, если что - либо еще пересекает порог на официально проваливающейся территории. : smartd.conf(5)Говорит:

-i ID [ATA only]Игнорировать идентификатор номера атрибута устройства при проверке сбоя атрибутов использования. ID должен быть десятичным целым числом в диапазоне от 1 до 255. Эта директива изменяет поведение директивы '-f' и без нее не действует.

Это полезно, например, если у вас очень старый диск и вы не хотите получать сообщения о сбоях атрибута продолжительности жизни (обычно атрибута 9). Эта директива может появляться несколько раз для одного устройства, если вы хотите игнорировать несколько атрибутов.


Расширенные атрибуты истории температуры

Я только что получил новую 6 ТБ Seagate Barracuda (ST6000DM003-2CY186 с прошивкой 0001, привод 5425 об / мин), в которой есть некоторые интересные характеристики, включая время, потраченное на превышение минимальных / максимальных рабочих точек, а также высокий / низкий кратковременные и кратковременные временные температуры ,

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    33 Celsius
Power Cycle Min/Max Temperature:     27/33 Celsius
Lifetime    Min/Max Temperature:     27/33 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (2)

И в подробном разделе:

0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              33  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              33  ---  Highest Temperature
0x05  0x028  1              30  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature

(Диск был включен только на пару минут; возможно, поэтому -в некоторых полях данные отсутствуют).

Если у вашего привода есть эти расширенные атрибуты, вы можете показать кому-то, что время, проведенное за пределами допустимой температуры, было очень коротким (если это так). Предположительно, если бы вы собирались изменить данные SMART, вы бы просто сделали это и удалили все упоминания о том, что они вне диапазона, но, очевидно, вы не можете на 100% доверять любым данным с подержанного диска, который кто-то пытается продать тебя.

См. Https://superuser.com/questions/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist для получения дополнительной информации об используемых дисках с например, «откат одометра» в их атрибуте «Power_On_Hours».

Питер Кордес
источник
Спасибо, Питер, за тщательный анализ здесь. Высоко ценится.
Луис Альварадо
0

Насколько мне известно, единственный способ остановить это - отключить SMART в BIOS. Это только остановит ТС, хотя.

Ваша ОС по-прежнему будет запрашивать информацию о SMART на диске и сообщать вам, что она не работает.

Jesseryte
источник