Проверьте наличие ошибок жесткого диска / признаков отказа на CentOS Server

14

Какой лучший способ проверить наличие ошибок жесткого диска и ранних признаков сбоя в CentOS?

INAC
источник
1
как часто должны проводиться проверки? ежедневно - еженедельно?
Инак

Ответы:

3

Я бы порекомендовал установить Smartmon ( http://sourceforge.net/apps/trac/smartmontools/wiki ) на ваш компьютер. Это программное обеспечение, которое может проверять состояние ваших дисков, в противном случае оно будет проверять / var / log / messages или / var / log / syslog для любых упоминаний об ошибках scsi

Павел
источник
кажется, что smartmon, хотя в его статистике упоминается, что он будет отлавливать только 60% неисправных дисков ... если бы я настроил smartmon на ежедневное сканирование, помогло бы это быстрее умереть с жесткого диска - это seagate 7200.10?
Инак
@inac smartmon поможет hdds быстрее умереть? Где ты это прочитал? Пожалуйста, добавьте URL.
0:30
2
dmesg

Ядро будет регистрировать любые диагностические сообщения об устройствах ввода / вывода, поэтому вы можете проверить эти сообщения с помощью команды dmesg.

Banjer
источник
но вам придется запускать это вручную или cronjob dmesg dump в vi?
Инак
или. Вы можете создать скрипт, который будет выгружать его с помощью «dmesg> dmesg.dump.txt» и запускать его ежедневно с помощью cron.
Banjer
1

Вы можете запустить fsck на устройстве, чтобы проверить наличие ошибок.

cdated
источник
0

Как говорит Пол, журналы SMART - хорошее место для проверки.

Я также рекомендовал бы запускать BadBlocks . Если у вас есть карта RAID, вам, возможно, придется использовать мониторинг на этом.

Dentrasi
источник
0

SMART-мониторинг - это хороший способ. В качестве пользователя root, smartctl -a /dev/hdaгде hda - это нужный вам диск ... это может быть hdb, sda и т. Д. Также рекомендуется указать свой адрес электронной почты в / etc / aliases как лицо, которое должно получать почту root.

Это очень расплывчатый ответ. Если у вас есть сервер от одного из крупных производителей (Dell, HP и т. Д.), Скорее всего, есть лучшие возможности мониторинга.

churnd
источник
0

Вы можете попробовать полную проверку раздела / dev / sda1 (например) как

fsck -f /dev/sda1

или, попробуйте полный неразборчивый тест записи-чтения данного раздела

badblocks -vn /dev/sda1
Liibo
источник
/dev/sda1 is mounted; it's not safe to run badblocks!
0:30
e2fsck: Cannot continue, aborting.
0:30
@ 030 Перейдите на уровень выполнения, где основной диск не смонтирован.
awiebe