Моя компания пытается выяснить, какой тип SAN купить. Это специально для серверов баз данных, которые становятся ограниченными для ввода-вывода (сейчас хранилище - это DAS, но мы достигли предела одного сервера и хотели бы также добавить кластеризацию).
Нам нужно решение, которое будет производить около 3000 IOPS в долгосрочной перспективе (в настоящее время мы достигаем около 1000 IOPS). Большинство наших операций с базами данных - это небольшие операции чтения / записи. Основываясь на обсуждениях с инженерами HP и другими пользователями в сети, HP P2000 с 24 SAS HD в конфигурации RAID 10 будет стоить чуть меньше этой скорости за ~ 20 тысяч долларов. Добавление контроллеров и других элементов для построения сети SAN позволяет нам максимально сэкономить 30 000 долларов США.
Но в Интернете я вижу, что многие SAS SSD обеспечивают скорость 80 000 IOPS +. Это реально ожидать? Если это так, было бы реалистичным получить P2000 или аналогичный SAN начального уровня и добавить туда несколько SSD? Наши базы данных небольшие, всего пара ТБ. Если бы мы сделали это, у нас были бы оставшиеся деньги, чтобы купить второй SAN для зеркалирования / отработки отказа, что кажется разумным.
источник
Ответы:
Я могу говорить о специфике того, что вы пытаетесь достичь. Честно говоря, я бы не стал рассматривать HP P2000 / MSA2000 начального уровня для ваших целей.
Эти устройства имеют множество ограничений и, с точки зрения набора функций SAN, представляют собой не что иное, как коробку дисков. Нет многоуровневого, интеллектуального кэширования, максимум 16 дисков в группе виртуальных дисков , низкие возможности IOPS, плохая поддержка SSD (особенно на выбранном вами устройстве).
Вам нужно будет перейти на HP MSA2040, чтобы увидеть какие-либо преимущества в производительности или официальную поддержку твердотельных накопителей. Кроме того, вы действительно хотите использовать iSCSI?
DAS может быть вашим лучшим вариантом, если вы можете терпеть локальное хранилище. Флэш-память PCIe войдет в ваш бюджет, но емкость нужно будет тщательно планировать.
Можете ли вы уточнить спецификации ваших реальных серверов? Марка / модель и т. Д.
Если кластеризация обязательна, другой вариант - использовать модуль HP MSA2040, но вместо iSCSI использовать модуль SAS. Это дешевле, чем в других моделях, позволяет подключать 4–8 серверов, обеспечивает низкую задержку и высокую пропускную способность, а также поддерживает SSD. Даже с моделями Fiber или iSCSI этот аппарат даст вам больше гибкости, чем тот, который вы подключили.
источник
Основное правило, которое я использую для дискового ввода-вывода:
75 IOP на шпиндель для SATA.
150 IOP на шпиндель для FC / SAS
1500 IOP на шпиндель для SSD.
Помимо количества операций ввода-вывода в секунду на массив, учитывается количество операций ввода-вывода в секунду на терабайт. При использовании SATA + RAID6 нередко получается очень плохое соотношение IOP на ТБ. Это может звучать не так уж и много, но вы часто сталкиваетесь с тем, что кто-то замечает «свободное место» в массиве, и хотите его использовать. Люди часто покупают концерты и игнорируют iops, когда в большинстве корпоративных систем действительно происходит обратное.
Затем добавьте стоимость штрафа за запись для RAID:
Штраф записи может быть частично смягчен хорошими большими кэшами записи и при правильных обстоятельствах. Если у вас много последовательных операций записи (например, журналы БД), вы можете значительно снизить эти штрафы на запись в RAID 5 и 6. Если вы можете написать полную полосу (например, один блок на шпиндель), вам не нужно читать, чтобы вычислить четность.
Предположим, 8 + 2 RAID 6 набор. При нормальной работе для однократной записи ввода / вывода вам необходимо:
При кэшированной записи с полной полосой - например, 8 последовательных «блоков» размером полосы RAID, вы можете рассчитать паритет по всей партии без необходимости чтения. Таким образом, вам нужно всего 10 записей - по одной на каждые данные и две четности.
Это заставляет вас писать штраф 1.2.
Вы также должны иметь в виду, что запись IO легко кэшируется - вам не нужно сразу записывать ее на диск. Он работает в мягких временных рамках - если ваши входящие записи в среднем не превышают скорость шпинделя, все они будут работать с «скоростью кеша».
Чтение ввода-вывода, с другой стороны, ограничено по времени - вы не можете завершить чтение, пока не будут получены данные. К этому моменту становятся важными алгоритмы кэширования чтения и загрузки кэша - предсказуемые шаблоны чтения (например, последовательное, как вы получите из резервной копии) могут быть предсказаны и предварительно выбраны, а случайные шаблоны чтения - нет.
Для баз данных я бы вообще предложил вам предположить, что:
большая часть ваших операций ввода-вывода базы данных считывается случайным образом. (например, плохо для произвольного доступа). Если вы можете позволить себе накладные расходы, RAID1 + 0 хорош - потому что зеркальные диски дают два источника чтения.
большая часть вашего 'log' IO - это последовательная запись. (например, это хорошо для кэширования и вопреки тому, что предлагают многие администраторы баз данных, вы, вероятно, захотите использовать RAID50, а не RAID10).
Соотношение двух сложно сказать сложно. Зависит от того, что делает БД.
Поскольку случайный ввод-вывод является наихудшим случаем для кеширования, именно здесь SSD действительно вступает в свои права - многие производители не беспокоятся о кешировании SSD, потому что в любом случае скорость его работы примерно одинакова. Так что особенно для таких вещей, как временные базы данных и индексы, SSD дает хорошую отдачу от инвестиций.
источник
Ваш анализ довольно правильный.
Используйте несколько жестких дисков для большого количества ГБ и множество жестких дисков для нескольких операций ввода-вывода.
Используйте несколько SSD для большого количества IOP и множество SSD для нескольких ГБ
Что для вас важнее? Пространство является основным фактором, влияющим на стоимость решений SSD, поскольку цена за ГБ намного выше. Если вы говорите о базе данных объемом 200 ГБ, требующей 4K IOP, пара SSD доставит вас туда. Или массив из 24 дисков по 15 КБ, оставляющий много места для хранения данных.
Количество операций ввода-вывода, которые вы фактически получите от этих твердотельных накопителей, сильно зависит от инфраструктуры хранения (подробно об этом расскажет www.wwhite), но разумно получить такие скорости. Особенно с Raid10, где четность не вычисляется.
источник
Недавно я построил пару серверов хранения для своего работодателя, используя шасси Dell C2100, работающее под управлением FreeBSD 10.1 с двенадцатью жесткими дисками SATA для предприятий Enterprise Digital "SE" по 2 ТБ 7200 об / мин. Диски находятся в одном пуле ZFS, состоящем из двух 6-дисковых виртуальных устройств RAIDZ-2 (vdevs). К пулу подключена пара твердотельных накопителей Intel DC S3500, которые защищены суперкапами от потери питания, они используются как SLOG и L2ARC. Нагрузочное тестирование этого сервера через iSCSI, мне удалось достичь 7500-8200 IOPS. Наша общая стоимость, включая жесткие диски, составила около 2700 долларов за сервер.
За время работы этих систем на базе BSD один из наших блоков SAN HP MSA2012i столкнулся с двумя сбоями контроллера, а наш другой блок MSA2012i повредил большой том NTFS, требующий 12 часов простоя для ремонта.
Dell и HP продают вам 10% оборудования и 90% обещают поддержку, которую вы никогда не сможете использовать.
источник