SmartD действительно сообщает, что этот диск слишком горячий?

9

Msgstr "Атрибут использования SMART: 194 Температура по Цельсию изменена с 146 на 150". Это на CentOS 6.6.

Что это на самом деле значит? Диск действительно горячий или это программная ошибка? Накопитель емкостью 2 ТБ eSATA, на ощупь прохладный, а сервер в подвале - 70F.

# smartctl -A /dev/sdb
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-504.16.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   134   134   054    Pre-fail  Offline      -       89
  3 Spin_Up_Time            0x0007   123   123   024    Pre-fail  Always       -       507 (Average 505)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       89
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   135   135   020    Pre-fail  Offline      -       26
  9 Power_On_Hours          0x0012   096   096   000    Old_age   Always       -       29541
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       71
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       205
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       205
**194 Temperature_Celsius     0x0002   150   150   000    Old_age   Always       -       40 (Min/Max 20/49)**
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       9
Edward_178118
источник

Ответы:

13

Это просто значение атрибута SMART. Это не температура в любой обычной единице. (это больше похоже на число от 255 (действительно очень холодно) до 0 (действительно очень жарко), в зависимости от того, что на диске горячее, а что нет)

Если вы хотите увидеть темп использования вашего диска smartctl -A /dev/sdx

Вы получите таблицу так:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   107   097   000    Old_age   Always       -       45

RAW_VALUE это то, что вы ищете ... (мой диск довольно теплый при 45 ° C)

VALUEэто значение атрибута, и когда оно становится ниже THRESH, накопитель готовится запросить замену. (Не все атрибуты имеют порог, как и моя температура)

Что касается того, что горячо, а что нет, то это действительно зависит от драйва. В Google есть несколько устаревшая статья о частоте отказов дисков, в которой говорится, что диски с температурой около 40 ° C имеют самые низкие показатели отказов (по крайней мере, для Google и в 2007 году). Я помню, как читал другую статью (сейчас не могу ее найти), в которой говорилось, что высокая температура не является проблемой для жесткого диска. Резкие и частые изменения температуры могут привести к преждевременному выходу диска из строя. Так что, пока температура диска довольно стабильна (вы можете отслеживать это, используя что-то вроде munin ), у вас все будет хорошо.

smartdсообщает о любых изменениях в атрибутах. Это не значит, что что-то не так.

Лиса
источник
1
Спасибо. Пожалуйста, смотрите выше, я обновил это с выводом smartctl. RAW_VALUE - 40. Это 40 градусов по Цельсию, что составляет 104F. Это считается горячим? Или становится жарко, и это регистрируется, потому что это может быть опасной тенденцией? Но Мин / Макс составляет 20/49, так что, по крайней мере, пока не слишком жарко,
Edward_178118
1
@ Edward_178118 обновил ответ, надеюсь, это поможет.
Фокс
Таким образом, пороговые значения 150 не имеют никакого отношения к 150C?
Edward_178118
Точно. 150 будет слишком жарко. Даже слишком горячий для процессора, который получает радиатор, чтобы оставаться ниже 80 или около того.
Фокс