Скорость диска в сети хранения данных

11

В настоящее время мы рассматриваем покупку SAN, и у нас есть некоторые опасения по поводу скорости дисков, которые мы собираемся поместить в массив. Обычно мы бы использовали 15-килобайтные диски более чем на 10 тыс. Каждый раз, но один из поставщиков сказал нам, что мы не заметим большой разницы между двумя, и разница в цене будет совсем другой.

Мы смотрим на HP 2040 или 4400 san с дисками SAS. Не увидим ли мы большой разницы между дисками, и если нет, то почему?

beakersoft
источник
2
Не зная, каковы ваши требования к производительности, на самом деле нет хорошего способа сообщить вам, заметите ли вы заметную разницу между дисками SAS 10 и 15 КБ. Кроме того, существует огромная разница между HP MSA 2040 и EVA 4400 - зачем вам даже смотреть на EVA более 3Par в этот момент?)
Rex
Спасибо за ответы, парни, теперь имеет больше смысла!
beakersoft
@beakersoft Но как насчет деталей окружающей среды?
ewwhite

Ответы:

9

Производительность хранилища может быть немного сложной, но основополагающее утверждение верно. 10k или 15k имеют схожую производительность, по большей части. Если вы разместите их рядом, выполняя ту работу, с которой диски работают хуже всего (случайный ввод-вывод для небольших блоков), вы будете измерять разницу, но реальность такова, что с большинством контроллеров хранения это довольно редко.

В наши дни, когда большая часть хранилищ может устанавливать горячие точки на свой собственный уровень, потребность в тяжелом 15-тысячном уровне значительно снижается, поскольку большая часть работы с интенсивным чтением при вводе-выводе может быть перенесена на более высокий уровень SSD. В моей среде единственное место, в котором мы действительно нуждаемся, это огромные базы данных, которые стоят 99% времени, но нуждаются в кричащей производительности для квартальных и годовых отчетов, которые затрагивают почти все данные.

Бэзил
источник
11

Как правило, вы не заметите разницы между современными 2,5-дюймовыми и 15-тысячными корпоративными SAS-дисками в чем-то вроде массива хранения HP MSA 2040 ... Вы столкнетесь с другими ограничениями платформы, прежде чем это станет проблемой. Когда люди обеспокоены этим разница задержки, это почти имеет больше смысла проводить твердотельные накопители (которые являются поддерживаемыми в 2040 единице).

Со всем хранилищем это зависит от ваших ожидаемых шаблонов доступа (с смещенным чтением / смещенным при записи / смешанным?), Требований к производительности приложений (база данных / приложение / виртуализация?), Транспорта (оптоволокно / SAS / iSCSI) и состав массива ( Уровень RAID, количество дисков).

Можете ли вы предоставить более подробную информацию о том, что вы планируете делать с массивом? Я смогу уточнить этот ответ.

ewwhite
источник
8

«Производительность» включает две основные метрики для доступа к диску: пропускную способность и количество операций ввода-вывода.

Скорость вращения дисковых дисков в первую очередь влияет на IOps. Быстрее диски => больше IOps.

У меня на домашнем сервере стоят более дешевые диски со скоростью 5400 об / мин, чем 85 МБ / с. Seagate 300 ГБ Cheetah 15K.7 (очень современный диск) рассчитан всего на 125 Мбит / с, не намного быстрее, но в 10 раз дороже.

Но у моих дисков очень плохие операции ввода-вывода, как будто они почти двузначные. Вам нужны IOps, если вы делаете много маленьких операций чтения / записи повсюду. Привод Cheetah получает 500 IOps (в среднем). Таким образом, при написании тонны крошечных файлов или множества небольших обновлений БД Гепард будет примерно в 50 раз быстрее.

В настоящее время доступно 5400, 7200, 10k и 15k дисков. Что вам нужно, зависит от того, что вы будете делать с ними. Для архивного хранения медленные диски дешевы и все еще получают хорошую пропускную способность. Для OLTP вы хотели бы купить деньги с наибольшим количеством операций ввода-вывода в секунду. Большинство людей падают где-то посередине.

Крис С
источник
2

Как правило, мы бы каждый раз брали 15 000 дисков за 10 000, но один из поставщиков сказал нам, что мы не заметим большой разницы между двумя

Это абсолютно верно, если это не SAN низкого уровня. Кэширование - особенно когда используется больший буфер SSD - может фактически убить эти различия. Например, я сейчас регулярно копирую файлы с 600 МБ - 900 МБ / с. На рейде 6 дисков 5400 об / мин. Задержки, как правило, состоят из одной маленькой цифры, несмотря на большую случайность и большую нагрузку при записи. Хитрость? Буфер обратной записи на 20% SSD.

Таким образом, на «правильном» сан с некоторой интенсивной буферизацией вы можете не увидеть такого большого количества различий. На самом деле, я бы сказал, что вы тратите кучу денег.

TomTom
источник