Эти ошибки SATA опасны?

36

Я получаю эти ошибки быстро, и я не знаю, нормально это или нет.

[39441.061856] ata3.00: failed to read SCR 1 (Emask=0x40)
[39441.061866] ata3.01: failed to read SCR 1 (Emask=0x40)
[39441.061892] ata3.15: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
[39441.061897] ata3.15: irq_stat 0x08000000, interface fatal error
[39441.061904] ata3.15: SError: { UnrecovData 10B8B BadCRC }
[39441.061910] ata3.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen
[39441.061917] ata3.01: exception Emask 0x100 SAct 0xe SErr 0x0 action 0x6 frozen
[39441.061923] ata3.01: failed command: READ FPDMA QUEUED
[39441.061933] ata3.01: cmd 60/a8:08:b0:48:62/00:00:00:00:00/40 tag 1 ncq 86016 in
[39441.061940] ata3.01: status: { DRDY }
[39441.061944] ata3.01: failed command: READ FPDMA QUEUED
[39441.061953] ata3.01: cmd 60/a8:10:b0:49:62/00:00:00:00:00/40 tag 2 ncq 86016 in
[39441.061959] ata3.01: status: { DRDY }
[39441.061963] ata3.01: failed command: READ FPDMA QUEUED
[39441.061972] ata3.01: cmd 60/58:18:58:4a:62/00:00:00:00:00/40 tag 3 ncq 45056 in
[39441.061978] ata3.01: status: { DRDY }
[39441.061987] ata3.15: hard resetting link
[39441.608302] ata3.15: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[39441.609090] ata3.00: hard resetting link
[39441.929246] ata3.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39441.929333] ata3.01: hard resetting link
[39442.249184] ata3.01: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39442.263242] ata3.00: configured for UDMA/133
[39442.277570] ata3.01: configured for UDMA/133
[39442.277725] ata3: EH complete

Я также вставляю smartctl -aдля sda , sdb и sdc .

Заранее спасибо за вашу помощь.

Маркос младший
источник

Ответы:

16

Хотя я, по сути, согласен с ответом Геппетва Д'Констанцо , я хотел бы предложить, чтобы некоторые из первых вещей, которые вы могли бы попробовать

  1. Убедитесь, что кабель SATA надежно подключен и подключен к разъемам на материнской плате и жестком диске.

  2. Замена вашего кабеля SATA. Кабели SATA (относительно) недороги, и иногда вы получаете « плохой ». Часто простая замена кабеля является самым простым способом диагностики и решения такой проблемы.

(Хотя несколько неожиданно, что два кабеля будут плохими одновременно. Тем не менее, это легко проверить, поэтому, на мой взгляд, это стоит того.)

Я только что видел, как вы, агенты, содержащие данные SMART для ваших дисков. Обратите внимание на неожиданно большое количество ошибок CRC для дисков sdbи sdc. Я предлагаю вам начать с проверки кабелей и соединений для этих дисков.

junior@mediacenter:/$ sudo  smartctl -a /dev/sda
...
Model Family:     SAMSUNG SpinPoint M7E (AFT)
Device Model:     SAMSUNG HM321HI
...
199 UDMA_CRC_Error_Count    0x0036   200   200   000   Old_age  Always -    0

junior@mediacenter:/$ sudo  smartctl -a /dev/sdb
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  -  57

junior@mediacenter:/$ sudo  smartctl -a /dev/sdc
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  - 398

ХОРОШО. Так что не латпоп тогда. ;-)
Конечно, если это происходит на ноутбуке, то ничего из вышеперечисленного не применимо, и я не уверен, какой совет предложить. Может быть, удалить и переустановить жесткий диск? Возможно, его просто нужно снова установить в гнездо, чтобы улучшить соединение?


sbdи sdcподключены к одному и тому же внешнему кабелю e-sata (док-станция Thermaltake Duo HDD). я заменю свой кабель e-sata.

Это может быть связано с неисправным или некачественным кабелем. Также может случиться так, что кабель каким-то образом перемещается, наталкивается или иным образом толкается во время использования привода.

иррациональный Джон
источник
1
sbdи sdcоба подключены к одному внешнему электронному шат кабеля (Thermaltake Duo HDD Dock). я заменю свой кабель e-sata.
Маркос Младший
9

Похоже, у вас плохое качество / поврежден SATA Power / Data Cable. Что может быть причиной плохих контрольных сумм. Они совсем не вредны, и вы можете жить с ними, но вы скоро потеряете много данных.

Отчет SMART о ваших жестких дисках выглядит нормальным, поэтому я за проблемы с питанием, основанные на моем опыте установки 5 жестких дисков в одном корпусе / источнике питания. Я закончил использовать внешний источник питания (475 Вт) для 2 дисков и 600 Вт корпуса для всего корпуса, включая GPU, оптические и жесткие диски.

В любом случае, я предлагаю вам выполнить полное резервное копирование, прежде чем делать что-либо еще. Если возможно, клонируйте свой жесткий диск, после чего вы должны проверить ваши кабели и напряжения источника питания.

Geppettvs D'Constanzo
источник
Из любопытства, действительно ли этот GPU был мощным и требовательным к энергопотреблению GPU?
иррациональный Джон
1
nVidia Quadro 4000, не то чтобы голодный
Geppettvs D'Constanzo
1
Интересный. У меня есть блок питания Antec (Neo-Eco) мощностью 400 Вт, 5 жестких дисков, 2 оптических привода и NVIDIA GeForce 9500 GT, и я не думаю, что у меня были какие-либо проблемы с питанием. У меня действительно есть ошибки CRC диска , но я думаю, что они из глупых ошибок пользователя, которые я сделал некоторое время назад. (Удар по кабелю и тому подобное.) Я не заметил никаких предупреждений в сообщениях ядра . Тем не менее, я полагаю, я должен внимательно следить за этим, чтобы быть в безопасности.
иррациональный Джон
1
1xIDE DVD-RW, 1xSATA DVD-RW и 1xSATA Blu-Ray ROM Оптические приводы на этой стороне. 4 SATA и 1 IDE HDD, GPU потребляют 142 Вт энергии. Я не могу сказать, что абсолютно уверен, что речь шла о проблемах с источником питания, но когда я добавил новый источник питания, проблемы исчезли. Кстати, мои диски кажутся здоровыми. Но спасибо, что заставил меня увидеть это. Ваше мнение действительно ценится в этой части. Спасибо!
Geppettvs D'Constanzo
1
142 Вт для GPU - это ... что-то. Вся моя система (обычно) использует меньше, чем это. Когда я набираю это, моя настольная коробка тянет ~ 117 Вт. (Согласно Kill-A-Watt, который я забыл, я все еще включаю его. ;-)
иррациональный Джон
4

Кажется, существует проблема между некоторыми версиями ядра и некоторыми контроллерами SATA.

Недавно я начал испытывать очень похожую проблему (не уверен, что она такая же) на веб-сервере с Scientific Linux.

Наиболее точная и полная информация о такой проблеме, которую я нашел, - это ошибка панели запуска .

Короче говоря, отключение NCQ, кажется, лучший обходной путь для пользователей, имеющих эту проблему.

jap1968
источник
3
Отключение NCQ является обычным обходным решением для неисправного оборудования. Кажется, что нет ошибки ядра.
psusi 31.12.12
Святой $ #! + Это сработало! Все мои сообщения об ошибках исчезли, и моя система перестала падать! Я полностью не согласен с не ошибкой ядра, так как я могу использовать более старую версию ядра (вплоть до версии как минимум 2.6) без сбоев. Я не могу поверить, что я не нашел это раньше!
Реукиодо
1

Это почти всегда плохой диск, у меня есть тысячи дисков, которые мы используем, и хотя эти ошибки никогда не приводят к его отказу, они приводят к повреждению файловой системы. Я думаю, что это действительно связано с проблемой платы контроллера на диске.

Я перепробовал все, чтобы решить эту проблему, исправить это заменить диск и все работает на тех же кабелях и контроллерах.

Удачи

user209235
источник
После более чем 30 лет поиска и устранения неисправностей, я могу заверить вас, что по моему опыту это почти всегда хитрый кабель. И поскольку они дешевы, сначала попробуйте.
Старейшина Гик
0

Я знаю, что эта ветка старая, но недавно я столкнулся с той же проблемой на недавно купленной машине с 6 слотами sata. Я установил компакт-диск и жесткий диск в 2 слота sata, расположенных рядом друг с другом, а затем приступил к установке Ubuntu без ошибок, пока не перезагрузился, после чего увидел ошибку ata8: hard reset link. Машина останавливается, до этого момента никогда не восстанавливается. Я попытался перезагрузиться несколько раз, и это не сработало. А потом я попытался заменить жесткий диск на одном из 4 доступных слотов, и он работал без проблем.

ultrajohn
источник
Вы имеете в виду, что вы изменили порт SATA, к которому подключен жесткий диск, верно? Или вы имеете ввиду замену всего жесткого диска на другой? Я думаю, что это первое, но просто двойная проверка
Xen2050
Это первое.
УльтраДжон
0

Была такая же проблема - в моем случае это было связано с тем, что 4-контактный адаптер SATA не был подключен плотно.

Андрей Покровский
источник
0

Эта ошибка опасна и может повредить ваш HD.

Чтобы решить это:

  1. Заменить кабель SATA.
  2. Если ошибка не устранена, подключите кабель SATA к другому разъему материнской платы (текущий разъем может быть окислен).
  3. Если ошибка не устранена, проблема должна быть в блоке питания (БП).

http://eliasoenal.com/2012/10/31/power-supply-failures-can-be-pretty-annoying-to-find/

josircg
источник
0

У меня такая же проблема. Я перепробовал все, но только через порт j-micron на моем asus p5k. У меня не было ошибок.

Но когда я подключил диск к другому источнику питания, он работал, и ошибки исчезли. Затем я вернул диск к исходному источнику питания, но к новому разъему питания, и это тоже сработало.

Мартин ван дер Мейлен
источник
0

Я знаю, что эта тема старая, но только столкнулся с той же проблемой, пришел сюда из Google.

  • получать ata3.01: failed command: READ FPDMA QUEUEDпо загрузке Kubuntu 16.04 LiveCD.
  • WINDOWS 7 будет работать с ошибками, некоторое время работает нормально, но зависает после просмотра YouTube.

Замена кабеля SATA ничего не сделала.
Заменил БП и проблема ушла.

marco_roboto
источник
0

Эта ошибка вряд ли повредит ваш жесткий диск, но, скорее всего, повредит вашу файловую систему (ы). Начните с определения того, какой диск выдает ошибки. Обычно это легко определяется рядом подходов, таких как:

1) Выполнение команды dmesg | grep ata3и поиск марки и модели жесткого диска. (поскольку ata3 - это порт, выдающий ошибку в вашей ситуации. Отрегулируйте соответственно), это даст вывод, подобный следующему:

dmesg | grep ata3
[    4.756081] ata3: SATA max UDMA/133 abar m2048@0xf7f26000 port 0xf7f26200 irq 135
[    5.071981] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    5.077850] ata3.00: HPA detected: current 1953523055, native 1953525168
[    5.077959] ata3.00: ATA-8: SAMSUNG HD103SJ, 1AJ10001, max UDMA/133
[    5.077960] ata3.00: 1953523055 sectors, multi 16: LBA48 NCQ (depth 32), AA
[    5.084057] ata3.00: configured for UDMA/133

Быстрый взгляд показывает, что диск, подключенный к ata3, является SAMSUNG HD103SJ.

2) Введите команду ниже:

find -L /sys/bus/pci/devices/*/ata*/host*/target* -maxdepth 3 -name "sd*" 2>/dev/null | egrep block |egrep --colour '(ata[0-9]*)|(sd.*)'

Это обеспечит выделение портов и имен устройств в одной строке, как показано ниже:

выход

Легко видеть, что устройству, подключенному к ata3, было присвоено имя устройства sdb.

3) установить lsscsi с sudo apt install lsscsiпомощью командыlsscsi

$ lsscsi
[0:0:0:0]    cd/dvd  ATAPI    iHAS124   F      CL9M  /dev/sr0 
[1:0:0:0]    disk    ATA      WDC WD2003FZEX-0 1A01  /dev/sda 
[2:0:0:0]    disk    ATA      SAMSUNG HD103SJ  0001  /dev/sdb 
[3:0:0:0]    disk    ATA      ST6000VN0033-2EE SC60  /dev/sdc 

Обратите внимание, что первая запись в каждой строке выше - это scsi_host, channel, target_number и LUN. Он помещается в скобки и каждый элемент разделяется двоеточием. При наличии нескольких устройств SCSI их записи сортируются в порядке возрастания.

Простое добавление 1 к первому числу в каждой строке вывода дает вам порт ATA. Вы можете найти более подробную информацию lsscsi здесь и здесь.

Поскольку в вашем случае мы наблюдаем ошибки как в 3.00, так и в 3.01, у вас есть несколько дисков, подключенных к одному и тому же порту ATA. Вы собираетесь тщательно проверить подключение к ata3.00 и ata3.01. Это может быть корпус с несколькими отсеками, подключенный к одному кабелю. Поскольку оба диска выдают ошибки, замена кабеля в вышеупомянутом отсеке для нескольких дисков должна устранить проблему для обоих дисков. Эти устройства обычно имеют внешний источник питания, который также может быть виновником и должен быть заменен, но кабель (являющийся самым слабым звеном) является наиболее вероятной основной причиной проблемы.

Источники:

Опыт

https://linux.die.net/man/8/lsscsi

http://sg.danny.cz/scsi/lsscsi.html

https://serverfault.com/questions/244944/linux-ata-errors-translating-to-a-device-name/868943#868943

Старейшина Гик
источник