Мониторинг производственного сервера [закрыт]

18

У нас есть 3 выделенных сервера, разделенных на несколько VPS с использованием openVZ. Мы используем munin для мониторинга VPS на производственных площадках и отслеживаем какой-либо из VPS, чтобы убедиться, что он перезапускает службу при сбое.

Дело в том, что нам нужен гораздо лучший способ для мониторинга всех наших серверов, поскольку у нас есть до 14 VPS, нам бы хотелось иметь центральный концентратор, где мы могли бы видеть не только данные, собранные munin, но и некоторые дополнительные статистические данные. в сетях и представлениях наших услуг.

Некоторые из наших требований:
- SMS-уведомление о сбое (возможность настройки определенной пользовательской проверки)
- Анализатор логов для apache error_log и некоторые другие.
- Должен быть центральным (имеется в виду один сервер и несколько узлов, собирающих данные).
- Не должен быть прост в установке, но прост в обслуживании.
- нужно быть свободным

На меня указали нагиос и отморозок, что ты думаешь? Благодарность,

Адам Бенаюн
источник

Ответы:

17

У меня есть аналогичная установка, кроме с Xen на месте. Я был очень счастлив с комбинацией:

  • Nagios для оповещения (использование PNP для облегченного отображения и Nagviz для панели мониторинга состояния сервиса)
  • Ганглии для исторического построения систем
  • OSSEC как HIDS и не менее важно как сборщик для централизованной регистрации
    • sidenote: Существует плагин Splunk для OSSEC, который очень хорошо интегрирует эти два инструмента , хотя я жду, когда они перенесут его на Splunk v4.
  • Splunk Наконец, после переноса нескольких плагинов Splunk мы планируем использовать Splunk с некоторой предварительной фильтрацией журналов (чтобы не перейти к ограничению бесплатных выпусков).

Я надеюсь, что разделение наших настроек мониторинга поможет вам :-)

Вот несколько полезных ссылок:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

Обновить:

Я забыл упомянуть, что мы также используем макет конфигурации Мэтта Симмонса Нагиоса, найденный здесь http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Этот макет сделал нашу конфигурацию Nagios вменяемой и намного проще в обслуживании (спасибо, Мэтт!)

faultyserver
источник
2
+1 за OSSEC + спленк. они очень хорошо работают вместе.
Sucuri
5

У меня был большой успех с Zabbix , он удовлетворяет все ваши очки в одном пакете.

альтернативный текст
(источник: zabbix.com )

Сложнее всего будет получить мониторинг журнала apache, но Zabbix расширяем, поэтому вы можете использовать LogWatch или какой-нибудь другой perl-скрипт для сбора данных за вас.

Дэйв Драгер
источник
2

Мне нравится OpManager, и он бесплатный до определенного количества узлов. Делает все вышеперечисленное, и довольно прост в установке и обслуживании.

ChickenMilkBomb
источник
1

Нагиос должен быть хорошим выбором. Прежде всего - он модульный и полностью соответствует вашим ожиданиям. Кроме того, он получил несколько хороших наград .

РЕДАКТИРОВАТЬ: не забудьте проверить этот ответ .

моторист
источник