Фон
Моя персональная настольная система дома имеет 5 накопителей SATA, установленных внутри. Недавно моя система начала выходить из строя странными способами, такими как случайная паника ядра, и я в конечном итоге отследил ее до случайных падений массива RAID. Иногда я мог загрузиться, иногда я не мог и так далее. После недолгой погони за проблемами с программным обеспечением, я, наконец, пошел извлекать диски и обнаружил настоящую причину их отказа: они были жарче, чем барбекю 4 июля! Вентилятор переднего корпуса заклинило, а на вентиляторе PS был ослаблен разъем питания, застрявший в решетке, поэтому внутренняя часть корпуса готовилась.
Когда я остановился, я нашел вентилятор дома и охладил эту присоску. Это бежало отлично со всем хорошим и холодным. Примерно в это же время я узнал, как получить показания температуры привода от SMART.
for i in a b c d e; do
sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done
Теперь я знаю, что с моим делом открыт вентилятор дома, постоянно вычищающий паутину, при которой диски работают под углом 31-32 °. Быстрый тест без вентиляции для репликации неисправного состояния показывает, что накопители довольно быстро разогнались до 40-х. Я не знаю, как это было плохо во время фактического сбоя или как долго это было так.
Помня об этом, я заменил неисправные вентиляторы, добавил еще пару, модернизировал передний, обдувая диски с 80 мм до 120 мм, и снова закрыл его. Когда он снова стоит в вертикальном положении, временной диапазон обычно находится на уровне 32 ° в нижней части набора и 37 ° в верхней части.
Вопрос
Каков общий безопасный диапазон рабочих температур для дисков SATA? Должно ли 37 ° вызывать беспокойство или повреждение диска не является проблемой до определенного момента?
Несмотря на то, что накопители, похоже, сейчас проходят испытания нормально, насколько вероятно, что в прошлом воздействие тепла могло привести к их выходу из строя сейчас?
Ответы:
37 градусов не должны быть проблемой вообще. Естественно, жесткие диски отличаются по своим характеристикам, некоторые могут работать горячее, чем другие. Вы должны проверить опубликованные спецификации дисков, которые у вас есть. Например, рабочая температура WD Caviar Black 1 ТБ составляет от -0 ° C до 60 ° C. Конечно, вы не хотите, чтобы ваш привод работал на 60 °, так как это может сократить срок его службы.
Google опубликовал очень интересное исследование (PDF) о состоянии и сроке службы жесткого диска, основанное на данных, собранных с их систем (многие тысячи жестких дисков). Это исследование говорит, что:
Их график показывает, что частота отказов не повышается, пока температура привода не превысит 45 градусов.
источник
Это только мой ограниченный личный опыт, но я пробовал несколько дисков в верхних 40C без проблем в течение 2-3 лет, так как я использовал бесшумный корпус (охлаждаемый небольшим вентилятором, чтобы избежать 50C). При таких временах я бы предположил более короткую продолжительность жизни и быструю смерть, а не случайное повреждение данных, но я могу ошибаться. В любом случае, под 40C-42C все в порядке.
Но не стоит недооценивать другие факторы, которые могут играть роль в повреждении данных:
1) Южный мост, в котором находится чипсет контроллера IDE / RAID, часто охлаждается только небольшим радиатором. Они имеют тенденцию нагреваться в нормальных условиях, поэтому повышение температуры окружающей среды из-за отсутствия воздушного потока в корпусе и большого количества жестких дисков может привести к повреждению данных.
2) Перегрев ОЗУ или ЦП является распространенной причиной ошибок памяти CRC, что приводит к повреждению данных. Мониторинг температуры процессора и выполнение тестов памяти очень важны в случае повреждения данных.
Если ваши текущие показатели SMART в порядке и не показывают некорректное число секторов, я бы посчитал диски безопасными для использования.
источник
В первоначальном сообщении говорилось, что пользователь не знает, насколько сильно нагрелись его накопители - некоторые диски записывают этот параметр, и он доступен через информацию SMART. Жесткий диск Sentinal - это один из инструментов, который сообщает о максимальной температуре за весь срок службы.
Я видел результаты для приводов Maxstor, WD & Seagate
Несколько моих внешних USB-накопителей, которые я использую для резервного копирования, показывают максимальные температуры 63 и 64 С соответственно! Я сейчас построил кулер для внешнего накопителя
источник
Я прочитал отчет, упомянутый выше, и проверил диапазон рабочих температур для жестких дисков Samsung, WD и Hitachi. Основываясь на исследованиях, я пришел к выводу, что приводы, работающие в диапазоне от 30 до 45 градусов, обеспечивают наименьшую вероятность сбоя; УМНАЯ высокая температура до 55 градусов не является причиной для беспокойства; и что температура Peek выше 60 градусов будет указывать на снижение ожидаемого срока службы привода.
Мои собственные тесты показывают, что в периоды интенсивного доступа следует ожидать повышения до 10 градусов.
Кажется, существует какой-то неизвестный фактор в работе, который вызывает ненормальную частоту отказов на внешних дисках. Хотя тепло, кажется, является частью проблемы, это не полный ответ. Я бы посоветовал всем пользователям внешних накопителей внимательно следить за температурой всякий раз, когда происходит изменение характера использования накопителей или окружающей среды. Это, кажется, некоторая «неизвестная» (не обычная) проблема, которая приводит к перегреву этих приводов.
В настоящее время я отвергаю объяснение компьютерного вируса, невежества пользователей, плохих протоколов USB и размещения дисков в неподходящем месте.
источник