Мониторинг оборудования DELL на сервере VMware ESXi 5.5

11

Несмотря на то, что я довольно много исследую эту тему в Интернете (если честно, я не являюсь системным администратором на полную ставку), я не могу этого понять.

У нас есть несколько серверов VMWare ESXi 5.5, некоторые из которых интегрированы в vSphere, а некоторые нет (по соображениям стоимости).

Все они используют стандартный образ ESXi, за исключением одного компьютера, на котором фактически выполняется образ DELL VMWare ESXi.

То, что я хотел бы выполнить, кажется простым: настроить систему так, чтобы она могла запрашиваться через SNMP с удаленного хоста, будь то snmpwalk, Nagios, PRTG и т. Д. Я хотел бы видеть информацию от датчиков температуры, установленных дисков и их состояния , скорость вентилятора, состояние блока питания и т. д.

У меня сложилось впечатление, что установка версии VMWare от DELL автоматически включит необходимые модули (OpenManage наиболее важно), но, похоже, это не так.

У меня есть противоречивая информация о том, возможно ли это вообще вообще, в некоторых документах говорится, что вы не можете запрашивать сервер DELL VMWare ESXi через SNMP и вам необходимо использовать клиент CIM. Затем есть VIB OMSA, которые можно установить, и т. Д.

Я предполагаю, что это довольно распространенное требование, но доступные документы тянут один во всех различных направлениях.

Возможно ли то, что я пытаюсь сделать (без полной среды vSphere)?

Счастливчик люк
источник
с OMSA наш сервер dell отвечает за продвинутый статус нашего внутреннего инструмента, т.е.
yagmoth555
И они работают под управлением VMWare ESXi? Можете ли вы сказать мне, что именно вы установили?
Lucky Luke
1
Вы должны заставить OSMA работать. это были два файла для установки, но я забыл название. Веб-страница на порту 1311 будет работать, когда ваш аддон будет установлен правильно
yagmoth555
1
Ну, смешно, ты так говоришь. Модель, с которой мне приходится тестировать, не совсем новая аппаратная часть, это PowerEdge 2970 и ей не менее 3-4 лет.
Счастливчик Люк
1
Я перешел на страницу загрузки Dell для их настроенного ESXi 6.0 ( dell.com/support/home/us/en/19/Drivers/… ) и, конечно же, мой новый, но сервер «начального уровня» не был указан в списке «Совместимые системы». "
Стив Бондс

Ответы:

5

Да, вы можете контролировать автономный хост ESXi с помощью любого программного обеспечения для мониторинга SNMP, но некоторые элементы могут быть видны только с помощью инструмента мониторинга, который поддерживает протокол CIM.

Все мои хосты ESXi являются частью vCenter, но мы контролируем их напрямую (используя IP-адрес хоста vmkernal) с помощью SolarWinds NPM. В ESXi 5.5 встроено 5 или 6 модулей CIM, которые обеспечивают работоспособность оборудования, но работоспособность карты RAID не входит в их число. Вам нужно будет добавить VIB Dell OMSA, который добавляет дополнительных агентов CIM, включая агента RAID-массива. Пост Брайана Аткинсона все еще лучший, который я нашел, который описывает процесс,

https://communities.vmware.com/people/vmroyale/blog/2012/07/26/how-to-use-dell-dset-with-esxi

Вам нужно только следовать инструкциям по установке OMSA ESXi VIB, если вы собираетесь использовать сторонний инструмент мониторинга, который выдает историческую информацию и делает оповещения. Если вы хотите использовать сервер Dell OMSA, вы можете установить его удаленно на сервере без поддержки, удаленно в виртуальной машине или локально в качестве виртуальной машины.

Сервер OMSA можно использовать для подключения к платам управления DRAC и iDRAC Out of Band (OOB / IPMI / iLo) или к хосту ESXi после установки VIB OMSA на хосте ESXi. Вы не увидите информацию о работоспособности RAID в DRAC или iDRAC - только при подключении сервера OMSA к хосту ESXi - я повторяю ключевое слово Server, чтобы не было путаницы между сервером, который действует как клиент для VIB OMSA, который установлен на хосте ESXi.

Некоторые полезные ресурсы:

Показать текущих поставщиков CIM на хосте ESXi https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2053715

Показать установленные в настоящий момент VIB на хосте ESXi из CLI хоста, esxcli software vib list

При подключении к серверу vCenter напрямую к хосту ESXi вы видите некоторые незначительные дополнительные сведения о работоспособности оборудования, но, как правило, если вы не видите нужного состояния оборудования на панели «Состояние конфигурации / работоспособности», то вам не хватает поставщика CIM и вам нужно найти и установить VIB на хосте ESXi. Когда вы добавите Dell OMSA VIB к хосту ESXi, вы увидите датчик хранилища, добавленный на страницу состояния работоспособности, которая показывает тома RAID, диски, контроллер и состояние батареи вашего контроллера хранилища. Вам может потребоваться сбросить датчики, чтобы он появился, и иногда это занимает от 15 до 20 минут в первый раз после установки VIB и перезагрузки хоста ESXi.

Если вы не видите датчик на странице состояния работоспособности хоста ESXi при подключении к клиенту vSphere, то вы, скорее всего, не увидите его при удаленном опросе датчиков с помощью программного обеспечения для мониторинга.

Также следует помнить, что не все серверы имеют одинаковые датчики, и вы не сможете получить одинаковое состояние работоспособности от всех в зависимости от аппаратного обеспечения сервера, карты RAID и версии CIM, доступной для комбинации. Вам также может потребоваться обновить или изменить VIB для карты RAID, чтобы работоспособное состояние работало. Поставщик CIM (в данном случае это VIB OMSA) связывается с аппаратным обеспечением через VIB устройства (драйвер реального устройства) и передает эту информацию брокеру CIM на хосте ESXi, также известном как демон CIM Broker. sfcbd). Когда вы опрашиваете ESXi Host на предмет работоспособности оборудования с помощью надежного программного обеспечения для мониторинга, он будет получать некоторую информацию с помощью запросов SNMP, некоторые с помощью CIM, а некоторые с помощью ESXi API (которые являются SOAP-запросами). Клиент CIM общается с процессом sfcbd на хосте ESXi.

Иногда процесс CIM просто перестает работать. Когда это произойдет, вы перезапустите процесс sfcbd-watchdog на хосте ESXi. Это перезапустит службу sfcbd, и опрос CIM снова будет работать. Из CLI хоста,/etc/init.d/sfcbd-watchdog restart

Я думаю, что это покрывает большую часть предметов, которые вам нужны для запуска.

mhughesnp
источник
После установки DELL VIB я вижу некоторую информацию HW в клиенте vSphere при удаленном подключении, отлично. К сожалению, по какой-то причине он не предоставляет данные через SNMP, я подозреваю, что это невозможно, и мне придется вернуться к CIM.
Счастливчик Люк
4

Я понимаю, что вы ищете; специальные примечания о том, как управлять и контролировать состояние автономного хоста VMware ESXi.

На практике подход должен быть немного другим. Я объясню, как я управляю хостами.

В ситуации, когда у вас есть несколько хостов ESXi под управлением vCenter, предполагается, что вы используете vCenter для мониторинга и состояния работоспособности , а не для запросов к отдельным хостам. Там есть всеобъемлющая тревога , что я устанавливаю в VCENTER для предупреждения о «Хост Hardware Health». Мне, как правило, все равно, блок питания, оперативная память, диск или какой-либо другой компонент, а скорее, что хост нездоров.

Мониторинг автономного хоста ESXi не будет очень полезным, поскольку задача драйверов Dell / HP - предоставить информацию vCenter. И я не верю, что это лучший способ опрашивать отдельных хостов таким образом. Конечно, это потому, что вы в идеале хотите, чтобы ваши виртуальные хосты управлялись централизованно.

Если вы запускаете vCenter с одним хостом, вы действительно получаете эту возможность, так что, возможно, это вариант для вашей среды.

Если вам нужен какой-то внеполосный мониторинг, не могли бы вы вместо этого запросить DRAC?

ewwhite
источник
Благодарю. У нас есть vCenter, но не для всех хостов. Лицензирование VMWare довольно странное и очень дорогое (как мне сказали), если вы превысите 3 хоста. Поэтому я пытаюсь найти другой способ для тех хостов, которые не включены в vCenter. Мне придется изучить маршрут DRAC, это скажет мне такие вещи, как сбой RAID и т. Д.?
Lucky Luke
В отличие от DRAC, OSMA выдаст информацию о состоянии диска или о рейде.
yagmoth555
0

Вы можете использовать превосходные https://exchange.nagios.org/directory/Plugins/Operating-Systems/*-Virtual-Environments/VMWare/check_vmware_api/details (с или без nagios), он использует API vmware, чтобы получить все API информация, необходимая для мониторинга оборудования:

check_vmware_api -H esxhost -u esx_user_read_only_role -p passwd -l runtime -s health [enter]
OK - All 450 health checks are Green 

Вам нужен Perl VMware SDK, но в остальном он довольно прост. Он работает для всех типов аппаратного обеспечения (пока датчики видны API VMware, они проверены).

natxo asenjo
источник
-1

Попробуйте zabbix ( http://zabbix.com ):

1) это идеальное, хорошо известное программное обеспечение для мониторинга мирового класса

2) вы можете легко начать с Zabbix-устройства, доступного также в виде предварительно сконфигурированного виртуального образа (на основе OpenSuSE).

3) он может контролировать хосты и машины ESX [I] с помощью веб-сервисов Vmware (например, веб-клиента). Вы можете использовать низкоуровневые правила обнаружения для автоматического обнаружения гипервизоров и виртуальных машин VMware и создания хостов для их мониторинга на основе предварительно определенных прототипов хостов.

4) вы сможете контролировать все оборудование серверов Dell с помощью SNMP через iDrac, включая raid-контроллер и состояние томов, физические диски / модули памяти / блоки питания и т. Д.

Все виды информации о состоянии аппаратного обеспечения [как она доступна в iDrac] могут быть доступны через SNMP (по крайней мере, на серверах с IDrac 7/8 - я реализовал мониторинг аппаратного обеспечения более 50 серверов поколения Dell 12/13 для моей компании в этом путь).

С идеальной функцией LLD (обнаружение низкого уровня) zabbix вы можете легко собрать все аппаратные компоненты для мониторинга без ручного перечисления и автоматически создать элементы для мониторинга (состояния, температуры, скорости вращения вентиляторов, размеры дисков и серийные номера и т. Д.), Триггеры (выражения для обработки данных мониторинга) и различные действия ...

Сергей
источник