Поэтому мы запускаем Groundworks (с Nagios) на CentOS для мониторинга наших различных серверов и процессов. Он настроен на автоматическую отправку сообщений электронной почты и SMS-сообщений, когда ситуация достигает ПРЕДУПРЕЖДЕНИЯ или КРИТИЧЕСКОГО состояния Обычно это работает отлично. Однако дважды у нас были проблемы с Postfix на том сервере, где Postfix решает прекратить отправку электронной почты. Последнее время длилось 4 дня, потому что никто из нас не заметил.
Это приводит меня к важному вопросу: как я должен контролировать свой сервер мониторинга?
Ответы:
Со вторым сервером мониторинга, конечно. Второй способ может быть намного проще, так как все, что ему нужно сделать, это контролировать первый. И это, конечно же, должно контролироваться основной системой мониторинга.
Если ваша группа является частью более крупной организации с отдельной ИТ-инфраструктурой, вы можете договориться о том, чтобы служба мониторинга другой группы следила за вашей.
Вы также можете убедиться, что сервер отправляет сообщение «все в порядке» каждый день, и привыкнуть к его поиску. (Конечно, это эффективно, только если вы не перегружены рутинными сообщениями.)
источник
Другие люди предлагают отправлять регулярные сообщения о том, что все в порядке, но лично я не согласен с этим. Мониторинг должен молчать, если нет проблем, и никогда не должен полагаться на то, что пользователь замечает, что что-то не так, например: «О, я не получал эту ежедневную электронную почту в течение нескольких дней». Особенно, если у вас есть несколько человек, отвечающих на предупреждения, каждый может подумать, что другой уже удалил ежедневное сообщение «Я в порядке».
У нас есть внешний сервис (которых сотни, но мы используем червя ) для проверки HTTP нашего сервера мониторинга, чтобы убедиться, что он работает и может выходить в Интернет. Это наша основная задача по мониторингу. Затем наш сервер Nagios контролирует все наши клиенты.
Но вы подняли хороший вопрос. Мы , вероятно , следует добавить HTTP URL , который проверяет очереди постфикса и если он показывает необычное количество сообщений, которые , вероятно , означает , что он имеет какой - либо в очереди, а затем поднять тревогу. Другим вариантом будет использование различных методов оповещения, скажем, не-SMTP агента доставки SMS, а также SMTP, который мы используем в настоящее время.
Однако в нашем случае я не могу вспомнить, чтобы у нас когда-либо был почтовый сервер. Конечно, все, для чего используется почтовый сервер - это отправка оповещений Nagios, поэтому конфигурация очень проста и почти никогда не меняется.
источник
Очевидно, ваш постфикс тоже должен отслеживаться, но это уже другая тема;)
Я использую плагин Nagios Checker для Firefox , он всегда работает в строке состояния на любом компьютере, которым я регулярно пользуюсь.
Кроме того, у меня есть собственный скрипт на внешнем хосте, который пингует хост nagios и отправляет SMS, если он не отвечает на эхо-запросы.
До сих пор (5+ лет) все работало нормально (стук по дереву).
источник
Для мониторинга серверов (в нашем случае это nagios), бесплатный или базовый план Pingdom или alertfox отлично работает.
источник
Первое: пусть он отправляет сообщения «Я жив» один или два раза в день. Во-вторых, для этой цели я использую старую машину, у которой есть другой GSM-модем, небольшой ИБП и т. Д. И выделенное (прямое) соединение с основным сервером мониторинга. Это помогает и в третьем пункте: убедитесь, что вы регулярно проверяете состояние своих систем мониторинга. Небольшая вспомогательная система мониторинга постоянно отображает страницу состояния основной системы в моем офисе.
источник
Если ваш сервер мониторинга доступен из интернета, его следует контролировать со стороны внешнего поставщика (например, websitepulse et. Al.).
источник