Мы расширяем нашу установку Nagios 3 и часто сталкиваемся с новыми NRPE или общими плагинами Nagios для тестирования нашей существующей инфраструктуры. Хотя это и дрянь, и было бы полезно получить сводку плагинов, которые пользователи Nagios больше всего ценят.
Пожалуйста, перечислите один плагин на пост, желательно с кратким описанием того, почему он вам нравится, и ссылку на MonitoringExchange или сайт разработчиков плагинов. Таким образом, люди могут голосовать за уже перечисленные плагины, и мы можем видеть их в порядке предпочтения.
По той же причине было бы лучше не перечислять плагины, которые уже упоминали другие. Если у вас есть что добавить в отношении плагина, который кто-то еще перечислил, оставьте комментарий к его ответу.
Благодарность!
источник
Наши самые полезные плагины - это те, которые проверяют нашу более высокую функциональность приложения. Например, у нас есть тесты, которые пытаются войти на веб-сайт, и тесты, которые пытаются отправить электронное письмо и проверить почтовый ящик pop3, чтобы убедиться, что он прибыл. Если что-то из этого сломается, мы можем использовать проверки более низкого уровня, чтобы увидеть, что не так. Pop3 мертв? МТА, МДА? Сервер базы данных? хранилище данных?
источник
Честно говоря, тот, который делает больше всего для меня, просто старый
check_disk
. Ничто не заставляет меня чувствовать себя настолько особенным, в том смысле, что «перестать есть пасту», как если бы вчера взорвался сервер, который работал нормально, бегал как сумасшедший, а потом узнал, что это потому, что я позволил дискам заполниться. Больше никогда в моей жизни не нужно делать это снова.(И не забудьте также проверить иноды, дети смотрят дома.)
источник
WebInject очень полезен для мониторинга веб-сайтов, если вы хотите выйти за пределы функциональности check_http; он может обрабатывать страницы входа и выполнять несколько шагов за одну проверку Nagios.
источник
Я считаю, что check_nfsmount полезен на многих моих серверах.
Изменить: Я бы также проголосовал check_snmp, если бы у меня был представитель, чтобы сделать это. Он используется на всех моих серверах, плюс логика check_hpjd, которую я использую на всех своих принтерах HP.
источник
Мой самый полезный - тот, который я написал сам, который проверяет сертификаты SSL на наших веб-серверах, чтобы я мог следить за истечением срока их действия.
источник
PNP (pnp4nagios.org) - генерирует графики в стиле RRD для любой проверки Nagios, которая выводит perf. данные. Потрясающе полезный, особенно когда пытаешься убедить разработчиков в том, что этот недавно установленный сервис действительно является причиной всех этих скачков ЦП ...
источник
check_nt (общение с NSClient или что-то похожее на эту тему) позволяет вам запрашивать WMI в окне Windows - если есть счетчик производительности, вы можете теперь отслеживать его с помощью Nagios.
источник
Это немного постыдный плагин, но если вы отслеживаете машины Windows с помощью NRPE, NagiosPluginsNT, кажется, работает довольно хорошо. ;-)
источник
Я бы согласился, что check_snmp - чрезвычайно ценный плагин; его можно использовать практически для любых целей, и все это отображается в SNMP. SNMP доступен в таких разных системах, как HP-UX, Tru64 и OpenVMS, без дополнительных установок.
Другой (не совсем) плагин, который очень полезен, это NagiosGrapher; У меня есть опыт в статье, которая объясняет больше, но также, чтобы другие могли использовать его без каких-либо трудностей, которые я испытал.
Один последний: NSCA. Вы можете написать скрипт на Perl, Ruby или ksh и передать результаты в NSCA.
Между гибкостью NSCA и SNMP в сочетании с отчетностью NagiosGrapher, это должно очень хорошо расширить ваш мониторинг.
источник
Мне нравится check_http, чтобы проверить, что мои сайты все еще работают, я расширил его, чтобы убедиться, что на нем можно найти определенный текст, после того как однажды моя хостинговая компания решила обслуживать пустые страницы, и мои проверки nagios все прошли, поскольку сервер все еще работал.
источник
Самым полезным для меня является тот, который я написал для своих нужд: nagios-check-webpage
Он загружает всю страницу с помощью js / css / images, с многопоточностью и gzip (за исключением большого количества полос), как настоящие навигаторы.
источник
Номер один - NagiosWSC. Позволяет осуществлять мониторинг агентов Windows без агента через WMI.
источник
Тот, который проверяет фактическую задержку при запуске веб-сайтов и сканирует ее на наличие скрытого тега «status: ok». Он обнаружил проблему с нашим кешем squid и проблему языкового набора, которая возникала только раз в несколько ночей в 3 часа ночи, когда кто-то заходил на сайт с браузером, который запрашивал интернациональную версию страницы на турецком языке.
Серьезно, настройте каждый тип мониторинга, какой только возможно. Странные ошибки и ошибки, которые вы можете обнаружить в сложной среде с хорошим мониторингом, просто удивительны. Кроме того, зарегистрируйте ваши данные о производительности в базе данных rrd и отобразите их в Cacti.
источник
Одним из наиболее важных плагинов является тот, который я написал сам: check_rdiff_backup. Я делаю резервные копии за границей, и Нагиос говорит мне, если и когда что-то случится с ними.
Если вы ищете плагин rdiff-backup, есть один, который вы можете найти в Google.
источник
check_curl для меня была находкой. Действительно отличался гибкостью при выполнении проверок веб-сайтов, а также обнаружил, что это намного проще, чем веб-инъекция, почти с той же функциональностью, которая мне нужна
источник
Не просто плагин, но получение twurl ( https://github.com/marcel/twurl ) для работы в качестве средства отключения оповещений было абсолютной находкой. Нет необходимости в SMS-оповещениях и просто удовлетворении всех сторон.
Подробная информация о том, как это было сделано: оповещения Nagios с использованием твиттера (с twurl) не срабатывает - извиняюсь за бесстыдную саморекламу;)
Другие вещи...
Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) невероятно полезен в сочетании со стандартной проверкой загрузки ЦП и числа процессов при определении того, когда / если привязан ввод-вывод, и каким образом , Использование nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) делает это еще проще.
источник
Ну, простые, простые и стандартные - check_disk, check_load, check_http достаточно хороши для большинства случаев (в основном мы хотим знать, работают ли серверы, сайты и так далее)
кроме check_disk и check_swap, есть check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details, который дает использование памяти ...
источник
Centreon определенно для графиков и всех функций Nagios!
источник
check_multiprocs используется с текстом ссылки check_nrpe
источник
Это что-то вроде мошенничества, потому что я проделал большую разработку, и он на самом деле проверяет много разных вещей одновременно, но самый полезный для меня плагин nagios - Resmon . Это агент, который вы запускаете на самом сервере, и nagios подключается через http для выполнения проверок. Я предполагаю, что это похоже на то, что делает nrpe, но с рядом различных дизайнерских решений.
источник
Я использовал два плагина. Один должен был предоставлять XML-поток предупреждений, а другой - отправлять уведомления через твиттер. Оба были полезны (кроме обычных плагинов). если вы считаете NRPE плагином, добавьте его тоже.
источник
check_apt действительно крутой и напоминает мне об обновлении моих серверов Debian.
источник
Недавно я начал использовать плагин check_multi , используя исправленную / улучшенную NRPE для больших выходных данных (из-за HTML и информации о производительности).
Это почти "один плагин, чтобы управлять ими всеми"! ;-)
источник