Мы используем Nagios для мониторинга довольно многих (~ 130) серверов. Мы наблюдаем за процессором, диском, оперативной памятью и несколькими другими вещами на каждом сервере. Я всегда использовал SSH для запуска удаленных команд, просто потому, что для этого не требуется никаких дополнительных настроек на удаленном сервере, просто установите nagios-плагины, создайте пользователя nagios и добавьте ключ SSH, все из которых я автоматизировал в сценарий оболочки. Я никогда не задумывался о влиянии производительности на использование SSH поверх NRPE.
Меня не слишком беспокоит удар по нагрузке на сервер Nagios (вероятно, он слишком сильно загружен процессором, загрузка процессора никогда не превышала 10%), но мы запускаем каждую удаленную проверку каждые 30 секунд, и у каждого сервера есть 5 разных проверок. выполнила. Я предполагаю, что SSH требует больше ресурсов для каждой проверки, но есть ли огромная разница? (IE достаточно разницы, чтобы гарантировать переключение на NRPE).
Если это поможет, мы отслеживаем сочетание физических серверов (обычно с 8, 12 или 16 физическими ядрами) и средние / большие экземпляры Amazon EC2.
источник
Помимо предложений, приведенных в других ответах, рассматривали ли вы возможность включения
ControlMaster
в .ssh / config файла nagios, чтобы в полной мере использовать мультиплексирование ssh ?Другими словами, ваше SSH-соединение «останется включенным», поэтому затраты на его установление минимальны, так как это произойдет только один раз. Это по-прежнему гарантирует конфиденциальность с помощью шифрования и защитит вас от того, чтобы оставить открытые порты TCP на серверах (хотя и защищенными). Кроме того, вы можете ограничить действия пользователя через ssh, ограничив количество команд, которые он может выполнять.
источник
У меня не было ничего, кроме проблем, пытаясь скомпилировать NRPE на разных ОС. SSH работал гладко и эффективно, и его было намного проще написать.
источник