SAN с несколькими SSD-дисками или множеством старомодных HDD?

9

Моя компания пытается выяснить, какой тип SAN купить. Это специально для серверов баз данных, которые становятся ограниченными для ввода-вывода (сейчас хранилище - это DAS, но мы достигли предела одного сервера и хотели бы также добавить кластеризацию).

Нам нужно решение, которое будет производить около 3000 IOPS в долгосрочной перспективе (в настоящее время мы достигаем около 1000 IOPS). Большинство наших операций с базами данных - это небольшие операции чтения / записи. Основываясь на обсуждениях с инженерами HP и другими пользователями в сети, HP P2000 с 24 SAS HD в конфигурации RAID 10 будет стоить чуть меньше этой скорости за ~ 20 тысяч долларов. Добавление контроллеров и других элементов для построения сети SAN позволяет нам максимально сэкономить 30 000 долларов США.

Но в Интернете я вижу, что многие SAS SSD обеспечивают скорость 80 000 IOPS +. Это реально ожидать? Если это так, было бы реалистичным получить P2000 или аналогичный SAN начального уровня и добавить туда несколько SSD? Наши базы данных небольшие, всего пара ТБ. Если бы мы сделали это, у нас были бы оставшиеся деньги, чтобы купить второй SAN для зеркалирования / отработки отказа, что кажется разумным.

Beep Beep
источник
3
Я отвечу на это в ближайшее время.
ewwhite
Можете ли вы дать ссылку на конкретную модель / тип SAN, которые вы хотите использовать? Есть много предостережений, которые идут с массивами хранения в стиле HP P2000. Как вы планируете подключиться? ISCSI? Волокно? SAS?
Ewwhite
Кроме того, что это за платформа базы данных?
Ewwhite
Вот модель, на которую я смотрел, просто с другой конфигурацией дисков: aventissystems.com/product-p/200385.htm . СУБД является SQL Server Standard 2008 R2. Мы действительно открыты практически для любой конфигурации / поставщика, если мы можем «дешево» масштабировать в будущем и при условии, что у нас будет скромный бюджет.
Звуковой сигнал
Сколько емкости вам нужно?
Ewwhite

Ответы:

4

Я могу говорить о специфике того, что вы пытаетесь достичь. Честно говоря, я бы не стал рассматривать HP P2000 / MSA2000 начального уровня для ваших целей.

Эти устройства имеют множество ограничений и, с точки зрения набора функций SAN, представляют собой не что иное, как коробку дисков. Нет многоуровневого, интеллектуального кэширования, максимум 16 дисков в группе виртуальных дисков , низкие возможности IOPS, плохая поддержка SSD (особенно на выбранном вами устройстве).

Вам нужно будет перейти на HP MSA2040, чтобы увидеть какие-либо преимущества в производительности или официальную поддержку твердотельных накопителей. Кроме того, вы действительно хотите использовать iSCSI?

DAS может быть вашим лучшим вариантом, если вы можете терпеть локальное хранилище. Флэш-память PCIe войдет в ваш бюджет, но емкость нужно будет тщательно планировать.

Можете ли вы уточнить спецификации ваших реальных серверов? Марка / модель и т. Д.

Если кластеризация обязательна, другой вариант - использовать модуль HP MSA2040, но вместо iSCSI использовать модуль SAS. Это дешевле, чем в других моделях, позволяет подключать 4–8 серверов, обеспечивает низкую задержку и высокую пропускную способность, а также поддерживает SSD. Даже с моделями Fiber или iSCSI этот аппарат даст вам больше гибкости, чем тот, который вы подключили.

ewwhite
источник
Спасибо! У нас есть все серверы HP, в первую очередь HP DL380. Единственные причины, по которым мы рассматривали iSCSI, заключались в том, что было проще расширить последние 4 сервера (если мы хотим передать данные других серверов в SAN), и что он был немного быстрее (10 ГБ против 6 ГБ).
Звуковой сигнал
Тем не менее, я посмотрю на MSA2040 ... не знаю, почему он не появился на нашем радаре раньше.
Звуковой сигнал
Я вижу замешательство ... Если вы не планируете расширяться за пределы 4 или 8 серверов, SAS работает довольно хорошо. И это не 10 ГБ против 6 ГБ ... это 10 ГБ против 4-канального интерфейса SAS 12 Гбит / с (48 Гбит / с на корпус).
ewwhite
Я только что увидел, что программное обеспечение Remote Snap работает только на iSCSI или FC ... мы надеялись использовать удаленную привязку для зеркалирования SAN для аварийного восстановления в конце концов. Или есть другой процесс через SAS, который позволил бы такую ​​же возможность?
Звуковой сигнал
@ Вероятно, я бы использовал другой процесс DR. Я не склонен полагаться на устройства хранения или репликации на уровне SAN. Но версии MSA2040 для 10GbE и FC лучше подойдут для вас.
14:30
6

Основное правило, которое я использую для дискового ввода-вывода:

  • 75 IOP на шпиндель для SATA.

  • 150 IOP на шпиндель для FC / SAS

  • 1500 IOP на шпиндель для SSD.

Помимо количества операций ввода-вывода в секунду на массив, учитывается количество операций ввода-вывода в секунду на терабайт. При использовании SATA + RAID6 нередко получается очень плохое соотношение IOP на ТБ. Это может звучать не так уж и много, но вы часто сталкиваетесь с тем, что кто-то замечает «свободное место» в массиве, и хотите его использовать. Люди часто покупают концерты и игнорируют iops, когда в большинстве корпоративных систем действительно происходит обратное.

Затем добавьте стоимость штрафа за запись для RAID:

  • 2 для RAID1, RAID1 + 0
  • 4 для RAID5 (или 4)
  • 6 для RAID6.

Штраф записи может быть частично смягчен хорошими большими кэшами записи и при правильных обстоятельствах. Если у вас много последовательных операций записи (например, журналы БД), вы можете значительно снизить эти штрафы на запись в RAID 5 и 6. Если вы можете написать полную полосу (например, один блок на шпиндель), вам не нужно читать, чтобы вычислить четность.

Предположим, 8 + 2 RAID 6 набор. При нормальной работе для однократной записи ввода / вывода вам необходимо:

  • Прочитайте «обновленный» блок.
  • Прочитать первый блок четности
  • Читать второй блок четности
  • Пересчитать паритет.
  • напишите все 3. (6 IO).

При кэшированной записи с полной полосой - например, 8 последовательных «блоков» размером полосы RAID, вы можете рассчитать паритет по всей партии без необходимости чтения. Таким образом, вам нужно всего 10 записей - по одной на каждые данные и две четности.

Это заставляет вас писать штраф 1.2.

Вы также должны иметь в виду, что запись IO легко кэшируется - вам не нужно сразу записывать ее на диск. Он работает в мягких временных рамках - если ваши входящие записи в среднем не превышают скорость шпинделя, все они будут работать с «скоростью кеша».

Чтение ввода-вывода, с другой стороны, ограничено по времени - вы не можете завершить чтение, пока не будут получены данные. К этому моменту становятся важными алгоритмы кэширования чтения и загрузки кэша - предсказуемые шаблоны чтения (например, последовательное, как вы получите из резервной копии) могут быть предсказаны и предварительно выбраны, а случайные шаблоны чтения - нет.

Для баз данных я бы вообще предложил вам предположить, что:

  • большая часть ваших операций ввода-вывода базы данных считывается случайным образом. (например, плохо для произвольного доступа). Если вы можете позволить себе накладные расходы, RAID1 + 0 хорош - потому что зеркальные диски дают два источника чтения.

  • большая часть вашего 'log' IO - это последовательная запись. (например, это хорошо для кэширования и вопреки тому, что предлагают многие администраторы баз данных, вы, вероятно, захотите использовать RAID50, а не RAID10).

Соотношение двух сложно сказать сложно. Зависит от того, что делает БД.

Поскольку случайный ввод-вывод является наихудшим случаем для кеширования, именно здесь SSD действительно вступает в свои права - многие производители не беспокоятся о кешировании SSD, потому что в любом случае скорость его работы примерно одинакова. Так что особенно для таких вещей, как временные базы данных и индексы, SSD дает хорошую отдачу от инвестиций.

Sobrique
источник
Спасибо, мы на 100% RAID10, потому что мы сосредоточены на базах данных.
Звуковой сигнал
Это распространено, но это также ошибка. RAID10 на самом деле довольно расточителен для рабочих нагрузок, ориентированных прежде всего на запись. Записанный кешированный RAID5 / RAID6 имеет меньшие потери при записи, например, при записи файлов журнала базы данных.
Sobrique
3

Ваш анализ довольно правильный.

Используйте несколько жестких дисков для большого количества ГБ и множество жестких дисков для нескольких операций ввода-вывода.
Используйте несколько SSD для большого количества IOP и множество SSD для нескольких ГБ

Что для вас важнее? Пространство является основным фактором, влияющим на стоимость решений SSD, поскольку цена за ГБ намного выше. Если вы говорите о базе данных объемом 200 ГБ, требующей 4K IOP, пара SSD доставит вас туда. Или массив из 24 дисков по 15 КБ, оставляющий много места для хранения данных.

Количество операций ввода-вывода, которые вы фактически получите от этих твердотельных накопителей, сильно зависит от инфраструктуры хранения (подробно об этом расскажет www.wwhite), но разумно получить такие скорости. Особенно с Raid10, где четность не вычисляется.

sysadmin1138
источник
Спасибо за ответ! Разумно ли смешивать диски? Т.е. настроить 4 твердотельных накопителя для задач, ориентированных на производительность, а затем несколько жестких дисков для массового хранения?
Звуковой сигнал
3
@ Beepbeep Да, но будьте в курсе компромиссов. Многие iops будут потреблять ресурсы контроллера, а это означает, что вы не получите максимальную последовательную пропускную способность с жестких дисков. Множество последовательной пропускной способности на жестких дисках может вытеснить ввод-вывод с SSD, увеличивая задержку из-за конфликта каналов. Если это важно для вас, но их на разных каналах.
sysadmin1138
0

Недавно я построил пару серверов хранения для своего работодателя, используя шасси Dell C2100, работающее под управлением FreeBSD 10.1 с двенадцатью жесткими дисками SATA для предприятий Enterprise Digital "SE" по 2 ТБ 7200 об / мин. Диски находятся в одном пуле ZFS, состоящем из двух 6-дисковых виртуальных устройств RAIDZ-2 (vdevs). К пулу подключена пара твердотельных накопителей Intel DC S3500, которые защищены суперкапами от потери питания, они используются как SLOG и L2ARC. Нагрузочное тестирование этого сервера через iSCSI, мне удалось достичь 7500-8200 IOPS. Наша общая стоимость, включая жесткие диски, составила около 2700 долларов за сервер.

За время работы этих систем на базе BSD один из наших блоков SAN HP MSA2012i столкнулся с двумя сбоями контроллера, а наш другой блок MSA2012i повредил большой том NTFS, требующий 12 часов простоя для ремонта.

Dell и HP продают вам 10% оборудования и 90% обещают поддержку, которую вы никогда не сможете использовать.

катод
источник
Это правда ... Часть меня хотела порекомендовать сервер HP под управлением ZFS (или ОС на базе ZFS), так как он работал бы намного лучше, чем MSA / P2000 ... но я не хотел уходить по касательной.
ewwhite
О, у меня нет проблем с HP. HP и Dell делают отличное серверное оборудование. Обычно загружается лучше, чем шасси белого ящика iStarUSA или Norco. Но когда речь идет о критически важных устройствах (SAN / NAS имеет решающее значение в моей книге), я рекомендую решение с максимально возможной прозрачностью. Техника SAN - это большие черные ящики. Они отлично работают, пока не делают, и тогда вы до ***** Крик.
катод