Просто быстрый вопрос: есть ли причина сменить жесткий диск сервера через x лет до того, как он выйдет из строя (в конечном итоге он выйдет из строя), или я должен просто оставить его до отказа? У меня мало опыта в реальном администрировании серверов, поэтому мне интересно ...
hard-drive
hardware
Спирос
источник
источник
Ответы:
Отличная причина изменить это, если вы хотите добавить еще одну задачу в свой список дел, увеличивая вероятность того, что что-то пойдет не так.
Не говоря уже о шутках, на самом деле нет никаких причин, по которым я слышал о том, чтобы сменить диск раньше времени. Если у вас есть RAID, у вас уже есть защита (при условии, что у вас есть приличные резервные копии), и вы не генерируете ненужный материал в виде мертвого диска для утилизации, и вам не нужно излишне работать над устранением конфиденциальные данные с диска. Вы не будете тратить дополнительные деньги на новые накопители и не будете активно защищать от тех вещей, которые все равно могут пойти не так, как, например, неисправный контроллер накопителя, который не является распространенным источником неисправности накопителя, но может случиться.
С другой стороны, это может помочь вам обнаружить неустранимые ошибки диска, которые не вызывают аварийных сигналов на RAID-модуле, как это было с RAID 5. Мы были укушены этим и в итоге нуждались в восстановлении с нуля из резервной копии (так что даже в этом случае правильное резервное копирование поможет вам восстановиться.) Уровень RAID, учитывающий сегодняшние большие емкости дисков и невосстановимые погрешности ошибок, помог бы нам, если бы не резервные копии, которые спасли бы день.
У большинства администраторов есть неплохой план RAID и план резервного копирования, поэтому нет необходимости создавать дополнительные потери, заменяя диски без необходимости.
источник
Единственный раз, когда я мог бы рассмотреть это, если бы у меня была куча дисков из одной и той же партии, а другие в этой партии начали выходить из строя, то я мог бы рассмотреть это.
Если бы я был ограничен в пространстве, то, конечно, я бы сделал это - но только по той причине, что он стареет? Нет, потому что в среднем частота отказов в первый год аналогична частоте отказов в другие годы . (обратите внимание, что график разбит на первый год за 3 месяца, 6 месяцев, 1 год, но вам придется сложить их все вместе, чтобы получить шанс провала через 1 год). А если посмотреть на высокую загрузку дисков, то вероятность того, что в первый год она выйдет из строя, больше, чем в последующие три года вместе взятые.
Единственная корреляция с поздним выходом из строя диска была в более горячих комнатах, и мы держим наши серверные комнаты прохладными.
источник
Я все за инициативу, но я никогда не делал этого и никогда не слышал, чтобы кто-то делал это. Предположительно, у вас есть какой-то тип установки RAID и у вас регулярно создаются действительные резервные копии для рассматриваемой системы.
источник
Да, производительность и вместимость. Если старый жесткий диск выполняет постоянные операции чтения со скоростью 70 МБ / с и 100 операций ввода-вывода в секунду, а потенциальная замена выполняет устойчивые операции чтения со скоростью 200 МБ / с и 175 операций ввода-вывода в секунду, а также имеет в 3 раза больше емкости, чем можно было бы оправдать для покупки новых дисков и замены старых на новые просто для причины производительности / емкости. (и эти цифры полностью составлены, дело новее может быть значительно быстрее).
Теперь, что вы делаете со старыми дисками. Вы можете использовать их на тестовом сервере, или добавить их в резервную копию на дисковый массив, или сохранить их в качестве аварийных резервов. Или вы можете просто стереть их и отправить их на утилизацию.
Ваш средний сервер в настоящее время связан с IO больше, чем с процессором (или, по крайней мере, с моим). Поэтому, если у вас действительно старый сервер, у которого нет проблем с процессором или нехваткой памяти, у вас, вероятно, есть возможность значительно повысить производительность, заменив жесткие диски, которые стоят на несколько поколений от того, что вы можете легко купить, заменить их.
источник
Это зависит от воздействия, если жесткий диск неисправен.
Если у вас нет RAID
Если вы не заботитесь о доступности сервера, потому что служба может быть остановлена или потому что она находится в высокой доступности, и если у вас есть рабочая резервная копия данных. Я бы сказал, хорошо, пусть диск умирает и изменить его и восстановить данные, когда он выйдет из строя.
Если вы заботитесь о доступности, я скажу использовать RAID;)
Если у вас есть RAID (1, 5, 6, ...),
я бы сказал, зачем менять жесткий диск до отказа? RAID (и резервное копирование) здесь для этого. Замена жесткого диска на случай, если он может выйти из строя, может привести к поломке (восстановление рейда всегда рискованно)
Но это только моя точка зрения! Если вы считаете, что ваш диск может быть слишком старым, вы можете также изменить свой сервер.
источник
Некоторые диски умирают за 1 час, другие за последние 2 десятилетия.
Если он не вышел из строя или вышел из строя (что обычно можно установить с помощью мониторинга SMART или проблем с производительностью), то единственной другой причиной выбросить его является то, что он недостаточно большой или достаточно быстрый для ваших целей.
источник
С дисками вопрос не в том, выйдут ли они из строя, а в том, когда . Это механические устройства (если только они не используют твердотельные накопители, но у них есть свои предостережения), поэтому они рано или поздно потерпят неудачу.
Производители дисков стремятся сделать свои производственные процессы как можно более дешевыми, потому что даже один цент, сэкономленный на диске, может быть очень важным, когда вы производите и продаете их тысячи; но они, конечно, не хотят, чтобы их диски выходили из строя до истечения гарантийного срока, или они будут заменять их бесплатно все время; Таким образом, они с радостью потратят столько, сколько нужно, чтобы они прослужили, пока гарантия покрывает их ... но не больше ни цента
Конечный результат: большинство дисков имеют тенденцию выходить из строя вскоре после окончания гарантийного периода. Это, конечно, не общее правило, это всего лишь статистика, и ваш диск может выйти из строя сейчас или продлится до тех пор, пока он вам больше не понадобится ... но, по статистике, существует множество дисков, которые выходят из строя через несколько дней или месяцев после их гарантия истекла.
Конечно, покупка новых, когда они вам по-прежнему не нужны, может быть дорогостоящей ... но замена их после истечения срока гарантии и в любом случае будет дорогостоящей.
Теперь, если бы вы могли найти способ заставить их выйти из строя при сохранении гарантии (и при этом не потерять данные в процессе, т. Е. Иметь хорошие резервные копии RAID и ), ну, это было бы оптимально ;-)
источник
Я бы не заменил рабочий диск больше, чем заменил бы работающий блок питания. Оба в конечном итоге потерпят неудачу, но технически или финансово не имеет смысла заменять их без уважительной причины. Замените их, когда они начнут показывать признаки проблемы.
В случае с жесткими дисками тенденция такова, что если диск выйдет из строя рано, он, скорее всего, сделает это в первый год. На накопители, которые работали без перебоев в течение 6 лет, обычно можно рассчитывать, что они продолжат работать еще как минимум еще несколько лет. Очевидно, есть множество исключений, но это общая тенденция.
источник
Кроме того, имейте в виду, что большинство дисков серверного класса предъявляют более жесткие производственные требования и, как правило, более надежны, чем недорогие настольные накопители. Таким образом, помимо опасности замены «хорошего» диска в случае его возможного сбоя, выполнение этого для большого массива может составить большую сумму денег.
Кроме того, при использовании RAID рекомендуется иметь хотя бы один «горячий» резерв на сервере, чтобы он мог быстро начать восстановление и работать исправно, пока вы не приобретете замену по мере необходимости.
источник
Я сделал это на системах с нулевым временем простоя. На самом деле, вы также можете потерять другой диск при восстановлении RAID ... Я один раз заменил его, а потом снова заменил, когда другой диск начал выдавать ошибки во время восстановления.
Это действительно философский вопрос: если вы верите в проактивное стресс-тестирование (как массива, так и сердечно-сосудистой системы), то вам следует поменять местами свои диски. Но на самом деле, вы никогда не узнаете, какой диск пойдет дальше. Не исключено, что вы можете потерять только что замененный диск, прежде чем потеряете какой-либо из старых, проверенных дисков.
При этом я трачу свое время на стресс-тестирование своего решения для резервного копирования и оставляю диски в покое, пока они действительно не начнут выдавать ошибки.
источник