За последнюю неделю мой сервер (на котором работает Debian Jessie) дважды перезагрузился. В системном журнале я вижу это перед каждой перезагрузкой, и ни в одном другом месте:
Aug 15 13:32:58 hoshimiya kernel: [296512.005355] {1}[Hardware Error]: Hardware error from APEI Generic Hardware Error Source: 1
Aug 15 13:32:58 hoshimiya kernel: [296512.005360] {1}[Hardware Error]: It has been corrected by h/w and requires no further action
Aug 15 13:32:58 hoshimiya kernel: [296512.005361] {1}[Hardware Error]: event severity: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005362] {1}[Hardware Error]: Error 0, type: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005363] {1}[Hardware Error]: fru_text: CorrectedErr
Aug 15 13:32:58 hoshimiya kernel: [296512.005364] {1}[Hardware Error]: section_type: memory error
Aug 15 13:32:58 hoshimiya kernel: [296512.005365] [Firmware Warn]: error section length is too small
Некоторое гугление заставляет меня поверить, что это связано с тем, что моя ECC RAM обнаруживает и восстанавливает после ошибки. Это правильно? Если он восстанавливается, почему система перезагружается? Я хотел бы предотвратить перезагрузку системы, если это вообще возможно.