Десятки спонтанных перезагрузок

0

Я работаю над системой на базе SUSE Linux, которая работает 24/7 и работает около 3 лет, хотя я не могу сказать, что она не была перезагружена за это время.
9 июня, по-видимому, произошло какое-то закрытие сайта, но я не знаю, как это происходило.
С тех пор произошли бесчисленные мгновенные перезагрузки.

Неисправность возникла практически при любой мыслимой ситуации испытания, например Пользовательские приложения работают или нет, архивируют данные или нет, записывают новые данные или нет, запускают fsck после 20 или более сбоев или просто ничего не делают.

  • Оперативная память была заменена.

  • Вентилятор охлаждения на радиаторе процессора был заменен, так как он был довольно шумным (хотя через него дул более мощный вентилятор, всего в 20 мм).

  • Блок питания был заменен, а зеленый провод заземлен, чтобы предотвратить его отключение.

Похоже, что это приводит к тому, что перезагрузки происходят немного реже.

Видимо, хотя я этого не делал, на нем был запущен fsck [вероятно] [диск на 250 ГБ имеет раздел данных размером около 220 ГБ], но я не знаю, были ли проверены все разделы. Но он, по-видимому, работает непрерывно в течение 2 дней.

Кто-нибудь может подсказать, какие проблемы могут привести к тому, что Linux мгновенно умрет и перезагрузится?

Steve
источник
Как уже говорили другие, это звучит как аппаратная проблема. Но в будущем вам следует подумать о регулярных перезагрузках по расписанию, так же как вы должны регулярно планировать время простоя для исправлений. Как и сейчас, вы не знаете, могут ли быть причиной проблемы какие-либо изменения конфигурации, сделанные за последние 3 года. Сокращение этого временного окна многого стоит.
Jenny D

Ответы:

0

Это звучит как вопрос HW для меня. Может быть температура, блок питания или mobo.

Вы можете проверить журналы /var/log/*или вывод dmesg команда для подсказок

Оперативная память была заменена. Усталый охлаждающий вентилятор на радиаторе процессора заменен на   довольно шумно, хотя через него дует только больший вентилятор   на расстоянии около 20 мм Блок питания заменен, а зеленый провод - жестким   заземлен, чтобы предотвратить его отключение, но это просто означало перезагрузку   немного меньше задерживается.

Я бы проверил с ле датчики или внутри / Proc / ACPI / thermal_zone «(если применимо к вам) за любой признак перегрева.

Petter H
источник