Параметры общего хранилища для кластера ESXi HA

8

Я ищу рекомендации по опциям общего хранилища для поддержки кластера ESXi HA (обратите внимание, я НЕ прошу рекомендации по продукту / бренду / модели - я знаю, что это противоречит правилам). Я прошу рекомендации по технологии .

Компания, в которой я работаю, является малым бизнесом. На данный момент у нас есть один HP DL380 G9 с DAS с ESXi 6.0, на котором выполняется наше специальное приложение. Сейчас мы смотрим, как достичь HA / FT, используя наиболее экономичный вариант. Нам нужен HA / FT, потому что я - команда из одного человека, и я часто путешествую, поэтому отказоустойчивость / восстановление вручную недоступны.

Я понимаю, что нам нужно минимум 2 хоста ESXi (физический сервер) и общее хранилище для достижения HA / FT. Здесь, я думаю, это становится интересным: даже самый дешевый массив хранения начального уровня для нас, вероятно, является излишним. Наши требования к объему хранилища, вероятно, составляют около 200 ГБ, и мы не увидим, что это удвоение в течение как минимум 5 лет. Тем не менее, нам нужно общее хранилище для HA / FT.

Таким образом, будет очень признателен за любые рекомендации по моим вариантам. Спасибо.

Артур
источник
Как насчет NFS на базе NAS? Они могут быть очень дешевыми, но, опять же, дешевая будет более серьезной единственной точкой отказа, чем ваша текущая установка. В идеале вам нужны двойные блоки питания и контроллеры, а они недешевые. Что-то вроде HPA MSA было бы хорошо, но опять же не бесплатно. Где ты в мире? Я в Великобритании, возможно, мы могли бы поговорить об этом. О, и вы знаете, что FT ОЧЕНЬ тяжелая сеть, верно?
Chopper3
Я бы ответил, если бы этот вопрос не был закрыт.
ewwhite
@ Chopper3 Я рассмотрел запуск NFS на нашем QNAP NAS, но я чувствую, что модель, которая у нас есть, вероятно, не будет достаточно быстрой для отработки отказа. Я изучил HPE, но даже модель начального уровня довольно дорогая, и я думаю, что мы будем бороться, потратив большую часть нашего бюджета на лицензирование vSphere. Я, к сожалению, на Тайване, в противном случае хотелось бы пообщаться лично!
Артур
@ белый, я отредактировал свой вопрос (сделал опечатку), но я не уверен, что EEAA собирается снова открыть его .... возможно, используйте комментарий, чтобы ответить? Спасибо.
Артур
Где вы находитесь и насколько хорошо вы работаете с Linux?
ewwhite

Ответы:

10

Общие примечания (поток сознания):

  • Подумайте очень серьезно о том, что вы пытаетесь защитить.
  • Никто не использует VMware Fault-Tolerance. Хорошо, может быть, кто-то и делает, но есть слишком много ограничений, и сценарий использования особенно узок.
  • Серверы более надежны, чем вы ожидаете, особенно при работе с такими качественными системами, как HP ProLiant. Супермикро было бы другой историей ...
  • Оценить реалистичные режимы отказа. Сервер HP ProLiant Gen9 не просто выйдет из строя .
  • Вы можете столкнуться с ошибками отдельных компонентов, но внутренних избыточностей достаточно, чтобы изящно решить большинство проблем.
    • Серьезно, резервные источники питания, избыточные вентиляторы, RAID-массивы внутренних дисков, встроенные адаптеры NIC и FLR редко выходят из строя.
    • Добавьте мониторинг ILO, комплексные проверки работоспособности оборудования и диапазон элементов, влияющих на время безотказной работы, сводится к сбоям DIMM и проблемам системной платы.

Итак, теперь мы пришли к общему хранилищу. Общее хранилище становится точкой отказа, в зависимости от того, как оно спроектировано.

  • Что-то вроде массива MSA SAS является опцией и может работать с VMware и двумя хостами. Вы можете купить их голыми и добавить необходимую емкость.
  • Настройка с разделением ничего не будет полезной в некоторых отношениях, но добавляет определенные сложности.
  • Существуют варианты гиперконвергенции , такие как VMware vSAN , HPE StoreVirtual VSA или предложение Starwind Virtual SAN .
  • HPE VSA может быть бесплатно до 1 ТБ памяти для вашей установки.
  • SAN начального уровня не так уж и убедителен, учитывая, что ваши требования к пространству невероятно низки.
  • Можно использовать одно головное хранилище ... возможно, даже обычный сервер HP с выбранной ОС хранилища (Linux, экспортирующий NFS, Windows Storage Server и т. Д.)
  • Я задокументировал и обрисовал в общих чертах решение ZFS для Linux, которое может обеспечить отказоустойчивость с двумя головками и кластеризацию для хранилища: См .: https://github.com/ewwhite/zfs-ha.
  • Другое решение, которое может ничего не делать совместно с парой серверов, - это Zetavault .
  • Сопоставьте это с репликацией на уровне виртуальных машин Veeam или чем-то на основе массива, и вы охватите 99% потенциальных проблем с хранением.

Но опять же, это функция вашего риска. Люди могут легко пройти по кроличьей норе высокой доступности ...

Хозяева двойных гипервизоров ... хорошо. Тогда вам нужны ткани с двойным переключением? Сложенные выключатели? Агрегация каналов с несколькими шасси (MLAG / MC-LAG)? Один SAN с двумя контроллерами? Два SAN? Репликация SAN? Репликация ВМ? Репликация ВМ на разнородное хранилище?

Есть ли у вас разнообразие сил? Несколько PDU? Несколько блоков ИБП? Поддерживается ли сайт генератором?

Итак, что у вас осталось?

Я думаю, что лучше иметь несколько вариантов. Может быть, договориться о дополнительной помощи для покрытия. Документируйте решение достаточно хорошо, чтобы у клиента было несколько вариантов. Сделать DR или системный сбой runbook / script.

ewwhite
источник
спасибо за очень подробный ответ! Вы предоставили мне интересный взгляд на то, что «не настолько параноидален» в отношении надежности серверов. Я понимаю, что вы имеете в виду, когда рисуете линию остановки HA, у нас есть несколько PDU, работающих от двух ИБП и разных автоматических выключателей, но это так (без STS и т. Д.). Сказав это, нам определенно потребуются два хоста гипервизора, поэтому теперь мы сосредоточимся на предложенных вами вариантах общего хранилища. HPE VSA выглядит довольно привлекательно и увлечено решением ZFS (но на самом деле мои навыки сисадмина в Linux не оправдываются). Еще раз спасибо, очень ценится!
Артур
Что касается бюджета, мы надеялись вывести из строя систему хранения данных + новый DL380 G9 за 10 тысяч долларов США. Причина, по которой этот вопрос задается в первую очередь, заключается в том, что мы знаем, что это невозможно, если мы выбрали HP MSA или аналогичные коммерческие массивы хранения.
Артур
Поскольку ваши потребности в хранилище невелики, HP P2000 G3 со старым или старым запасом с 4 или 6 дисками SAS будет работать предсказуемо и может стоить менее 4 тыс. Долларов. Но подход VSA почти бесплатный, но вам нужен третий хост. Или просто использование другого сервера в качестве хранилища может быть достаточно разумным. Много вариантов.
ewwhite
1
Я бы тогда наверняка посмотрел на Starwind VSA. Нет необходимости в третьем узле, поддержке активно-активного сценария и, как результат, хорошей производительности.
batistuta09
5

Если ваша компания не может выдержать простои пользователей, VMware FT - ваш выбор. Для реализации этой функции вам определенно понадобится какое-то общее хранилище. В этом случае я бы порекомендовал взглянуть на программно-определяемые хранилища (SDS), которые все чаще используются для создания виртуализированных инфраструктур. При таком подходе вы можете виртуализировать локальные физические ресурсы хранения ваших хостов ESXi и превратить их в полноценную виртуальную сеть хранения данных. Сразу вспоминается VMware VSAN, но я хотел бы указать на некоторые очень интересные альтернативы, которые должны быть значительно дешевле в среде ESXi. Первый кандидат - HPE VSA: хороший уровень функциональности и раздражающее требование третьего узла голосования для кворума. Да, я знаю, вы все равно можете перейти на 2 узла, но если вы не согласны с простоями, кворум является обязательным. Второй кандидат, напротив, имеет минималистичную аппаратную часть с двумя физическими хостами и набором функций, таких как кэширование, сжатие данных и т. Д. Это StarWind vSAN . Оба решения имеют бесплатные версии, просто проверьте и посмотрите, как вы можете их использовать.

batistuta09
источник
2

Технология, которую вам лучше всего использовать - это «хранилище с программным обеспечением». Виртуальная машина, которая делает локально подключенные диски доступными для всех виртуальных машин, в идеале обеспечивая избыточность, позволяя использовать локальные диски на нескольких узлах одновременно (позволяя вам потерять узел, не потеряв все свои виртуальные машины). Поскольку мы не говорим о рекомендациях по продукту, я оставлю это на этом. Это все еще зарождающийся рынок, но есть несколько хорошо зарекомендовавших себя вариантов, которые бы отвечали всем требованиям.

Бэзил
источник
2
Потребность в 200 ГБ делает это немного сложнее. ОП должен наметить бюджет.
ewwhite