Zabbix сервер отправляет слишком много уведомлений

9

Я недавно установил Zabbix сервер на VPS и очень доволен им. Я установил клиент на ок. 6-7 других VPS и все работает нормально. Интерфейс гладкий, и он создает очень хорошие графики.
Моя единственная проблема с программным обеспечением состоит в том, что я настроил его на отправку уведомлений о проблемах, но я получаю от 30 до 60 писем каждый день. Всегда что-то рядом с «Сервер XXX недоступно: ПРОБЛЕМА», а минуту спустя: «Сервер XXX недоступен: ОК». Конечно же, Zabbix также распознает, когда существуют реальные проблемы, и, например, когда сервер был перезапущен. Мне просто кажется, что Zabbix очень быстро «сдается», а может и быстрее, чем то, что мне подходит. Я пытался решить эту проблему несколько раз, но отказался, так что теперь я пытаюсь использовать этот подход.

Кто-нибудь знает, как настроить точность этих уведомлений / триггеров?

anselmdk
источник
Вы используете шаблоны примеров по умолчанию? если это так, то, скорее всего, это элемент «status», который на самом деле не предлагается :) - вместо этого вы должны перейти на agent.ping, чтобы проверить доступность хоста
Richlv

Ответы:

9

https://www.zabbix.com/documentation/1.8/manual/escalations_and_repeated_notifications/delayed_notifications Я использую функцию эскалации Zabbix для подавления частых сообщений включения / выключения. В основном:

  • первые сообщения вызывают цепочку эскалации, без отправки вам электронных писем
  • затем Zabbix ждет 5 минут (или что бы вы ни настроили) перед отправкой уведомления.
  • если в течение этих 5 минут состояние триггера отключится, вы получите уведомление НЕТ, и все вернется в нормальное состояние.
  • Хорошая часть это, что до сих пор показывает deshboard

Олег

OlegBrrr
источник
Спасибо! Это похоже на то, что я искал. Я изменил настройки и теперь даю системе некоторое время, чтобы увидеть, как влияет отправка уведомлений.
anselmdk
После терпеливого ожидания (и ослабления некоторых веб-триггеров) электронная почта Zabbix, наконец, теперь работает правильно. Спасибо за совет!
anselmdk
5

Вы также можете настроить триггеры. Я нашел метод count () удобным.
Вместо запуска в last (0) попробуйте count (300,0, "eq")}> 5. Это вызывает исключение, если последние 5 проверок (при условии 60 секунд между проверками) не пройдены.

http://www.zabbix.com/documentation/1.8/manual/config/triggers

Вы также можете отключить сообщения OK, добавив условие «Значение триггера =« ПРОБЛЕМА »». Это изменение должно быть сделано в конфигурации действий.

http://www.zabbix.com/documentation/1.8/manual/config/actions

serverSentinel
источник
2
На самом деле, ваш пример подсчета вернет число значений за последние 300 секунд, равное 0. Затем вы сравниваете его с 5. Общий эффект - запуск события, если за последние 300 секунд произошло 5 или более значений «0».
G-Wiz