За последние несколько дней со мной уже дважды случалось, что мой сервер полностью отключался, что означает, что http, ssh, ftp, dns, smtp, в основном, ВСЕ службы перестают отвечать, как если бы сервер был выключен, за исключением того, что он все еще реагирует на пинг. Это то, что больше всего поражает меня.
У меня есть некоторые php-скрипты, которые вызывают огромную нагрузку (процессор и память) на сервере короткими пакетами, используемыми небольшой группой пользователей, но обычно сервер прекрасно «выживает» для этих пакетов, и когда он выходит из строя никогда не совпадают с такими пиками в использовании (я не говорю, что это не может быть связано, но это не происходит только после них).
Я не прошу, чтобы вы волшебным образом могли сказать мне конечную причину этих сбоев, мой вопрос: есть ли один процесс, смерть которого может привести к одновременному прекращению работы всех этих служб? Самое смешное, что все сетевые сервисы отключаются, кроме ping. Если бы сервер израсходовал 100% ресурсов процессора, то он не отвечал бы на пинг. Если произошел сбой apache из-за (например) сломанного php-скрипта, это повлияет только на http, а не на ssh и dns .... и т. Д.
Моя ОС - Cent OS 5.6
Что наиболее важно, после полной перезагрузки сервера, какие системные журналы я должен посмотреть? / var / log / messages не показывает ничего подозрительного.
источник
malloc()
1 ГБ оперативной памяти, на самом деле не означает, что вы собираетесь его использовать, поэтому диспетчер памяти отслеживает, сколько памяти ваша программа считает, и сколько памяти Программа фактически использовалась, и она фактически работает хорошо, большую часть времени. По крайней мере, до тех пор, пока более чем одна программа не захочет использовать все 1 ГБ, которые она считает, что имеет.Обычно это проблема ввода-вывода или дисковой подсистемы. Часто это сопровождается чрезвычайно высокой средней загрузкой системы. Например, система, детализированная на графике ниже, перестала отвечать (но была проверена), когда скрипт запускался неправильно, блокировал кучу файлов и нагрузка возросла до 36 ... в системе с 4 процессорами.
Службы, работающие в оперативной памяти и не требующие доступа к диску, продолжают работать ... Таким образом, сетевой стек (ping) работает, но другие службы останавливаются, когда требуется доступ к диску ... SSH, когда ссылается ключ или требуется поиск пароля. SMTP имеет тенденцию отключаться, когда средняя нагрузка достигает 30 или около того ...
Когда система находится в этом состоянии, попробуйте использовать удаленный
nmap
IP-адрес сервера, чтобы узнать, что происходит.Возможно, ваше ведение журнала не работает, если это проблема с диском или хранилищем ...
Можете ли вы описать настройку оборудования? Это виртуальная машина? Что такое макет хранилища?
Больше, чем ведение журнала, вы хотите увидеть, сможете ли вы построить график производительности системы и понять, когда это происходит. Посмотрите, соответствует ли это конкретному виду деятельности.
источник