Как мне интерпретировать результаты HDD SMART?

58

Мой ноутбук недавно стал немного ненадежным, и по какой-то причине я начал подозревать, что мой жесткий диск начинает выходить из строя. После небольшой охоты в Интернете я обнаружил Дисковую утилиту Ubuntu в системном меню и провел долгую диагностику SMART.

Однако, поскольку документация для Дисковой утилиты очень скудна ( palimpsest?), Я не уверен, как интерпретировать результаты:

Значение более 50 миллионов для частоты ошибок чтения, но тест хорош ?!

Например, частота ошибок чтения превышает 50 миллионов (!), А оценка оценивается как «Хорошая».

Так может ли кто-нибудь объяснить мне, как интерпретировать результаты этих тестов (особенно числа нормализованных, наихудших, пороговых и значений)? И, может быть, скажите мне, что они думают о результатах, которые я получил для моего жесткого диска? (Спасибо)

Marty
источник
Имеет ли значение «Аппаратный ECC восстановлен» то же значение, что и «Частота ошибок чтения»? Мой диск имеет 676 циклов питания, он работал от 285 дней и имеет 193M ошибок. По сравнению с моим, на вашем диске слишком много ошибок, но я просто размышляю здесь. В любом случае, я просто забеспокоился oO
danizmax
Ип - оба числа одинаковы!
Марти

Ответы:

54

У вас есть хорошее описание того, как SMART работает в Википедии . Но быстрое вступление:

  • Значение: это необработанное значение, которое сообщает контроллер. Обычно это легко понимаемое значение (например, часы работы или температура), но иногда это не так (например, частота ошибок чтения). Различные производители могут использовать разные структуры и значения для этих данных.

  • Нормализовано: нормализовано указанное выше значение, поэтому более высокое значение всегда лучше. Таким образом, 114 в показателях чтения / ошибки лучше, чем 113. Опять же, как ваш жесткий диск преобразует необработанные данные в нормализованное значение, зависит от поставщика.

  • Худшее: наихудшее нормализованное значение, которое ваш накопитель имел в прошлом (где 99, вероятно, является заводской настройкой).

  • Порог: когда нормализованное значение ниже этого значения, привод может выйти из строя.

Итак, ваш жесткий диск в порядке. Значение частоты ошибок чтения - это не время выхода из строя диска, а некоторая структура данных, которая зависит от производителя диска.

Хавьер Ривера
источник
если конкретный диск не сообщает нормализованное значение, то будет ли это означать наихудшее значение и пороговое значение в терминах или все диски используют нормализованные значения, и только некоторые из них выбирают их как «значение»?
DeveloperACE
25

Да, обычно необработанное значение для частоты ошибок чтения - это нонсенс. Значения, за которыми вы хотите следить, - это количество перераспределенных секторов, число ожидающих и не исправляемых в автономном режиме. Это количество поврежденных секторов, которые были, ожидают исправления или не могут быть исправлены, а необработанные значения, как правило, имеют смысл и представляют собой число секторов.

Если чтение сектора не удается, он становится ожидающим. В следующий раз, когда вы попытаетесь выполнить запись в этот сектор, накопитель попытается перезаписать его, и если это сработает, все вернется в нормальное состояние. Если он не может правильно записать сектор, он перераспределяет сектор из резервного пула. Если он не может этого сделать (возможно, он уже израсходовал запасной пул?), Он просто становится offline_uncorrectable и пытается прочитать или записать в него только ошибки.

psusi
источник
1
У меня есть диск, который почти не работает с частотой ошибок чтения. Тест не пройден только после того, как накопитель поработал некоторое время, может быть, 15 минут; в Windows симптом заключается в том, что любой доступ к диску зависает, поэтому я использую инструменты Ubuntu, чтобы определить, что не так, но я в растерянности относительно того, что он говорит не так с диском, поскольку частота ошибок чтения не Похоже, это указывает на возможную неисправность привода, но у него, безусловно, есть проблемы!
Майкл
Также следует добавить, что сами результаты теста неоднозначны. Общий тест говорит, что он провалился, но тест частоты ошибок чтения, несмотря на нелепое значение (100/100, наихудшее, нормализованное), говорит «ОК».
Майкл
9

Псуси гвозди это.

Если вы прочитаете таблицы данных (технические документы), например, на сайте seagate.com, вы увидите, как создаются, тестируются жесткие диски и как они действительно работают. Идеального жесткого диска не существует, никогда не было и не будет (история и факт). В старые времена нам приходилось вводить поврежденные сектора в контроллер жесткого диска из списка на бумаге, который входил в новую коробку дисковода, поэтому контроллер пропускает их.

Современные накопители имеют исправление ошибок. С первого дня сектора плохие.

Таким образом, они отображают их, это означает, что накопитель пропускает поврежденные сектора. На самом деле они «логически поменяны местами» - плохой сектор отображается на новый, хороший, запасной цилиндр (у него есть запасные цилиндры - думайте о цилиндрах как о гусеницах). Это все прозрачно для внешнего мира - за исключением утилиты SMART.

Каждый производитель может делать все, что пожелает, поэтому некоторые устанавливают количество ошибок равным нулю, даже если на момент изготовления диска может быть 10 неисправных секторов.

В прошивке привода есть правило 3 раза - он читает сектор 3 раза, а если все 3 раза он плохой, он может выполнить «перекалибровку» на лету и прочитать еще 3 раза. Если диск все еще не в порядке, он сопоставит этот сектор с одним из резервных секторов. Это глубоко в прошивке, но происходит постоянно в фоновом режиме, все прозрачно для пользователя.

Независимо от того, выбрал ли производитель сообщение о необработанных ошибках при 3 неудачных чтениях или после выполнения калибровки. Так что, как он говорит выше, это не важно, если у вас много дисков одного типа и вы видите некоторые странные тенденции.

Пункт 2: все жесткие диски имеют естественные ошибки чтения, вы можете узнать это и в Seagate, если хотите. но все они имеют ошибки на лету. и читаются снова, и обычно проходят проверку на ошибки CRC. если нет, диск пытается поменять его. Если вы круто работаете с диском, он прослужит долго, и у вас никогда не останется запасных цилиндров. но посмотрите на это, как говорит вам псуси!

Я набираю это на старом ПК, на котором запущен один из первых жестких дисков емкостью 1 Гб. и все еще хорошо. (Резервное копирование) (нет недостатка в охлаждении ...) Тепло является убийцей № 1 и скачками напряжения, я использую ИБП. ура и хорошего дня. Надеюсь, это поможет. (когда-либо видел сбой жесткого диска DatA General? и наполнял комнату огромным количеством алюминиевой ваты, кудрявых подсказок - тогда было очень весело ... никогда не скучно ...

jtgh
источник