Что такое сеть хранения данных и какие преимущества она имеет по сравнению с различными решениями для хранения данных?

35

Я предлагаю это как канонический вопрос о сетях хранения данных уровня предприятия.

Что такое сеть хранения данных (SAN) и как она работает?
Чем он отличается от сетевого хранилища (NAS)?
Каковы варианты использования по сравнению с хранилищем с прямым подключением (DAS)?
Чем это лучше или хуже?
Почему это так дорого?
Должен ли я (или моя компания) использовать один?

Massimo
источник
@Basil: как вы думаете, вопрос должен охватывать и NAS? Они принципиально отличаются от SAN (и уже есть вопрос, сравнивая их: serverfault.com/questions/81723/… ). Я хотел, чтобы это было конкретно о SAN. Я не удаляю ваши изменения, но буду признателен сообществу за отзыв об этом.
Массимо
Я делаю обслуживание файлов, как правило, является функцией большинства запоминающих устройств на рынке, которые большинство людей называют «SAN».
Василий
Я думаю, что вопрос, который я связал, охватывает это довольно хорошо, а также NAS концептуально намного проще (они в основном файловые серверы). SAN более сложный, модульный и дорогой. Расширение охвата этого вопроса до всех форм хранения сделало бы его слишком широким. Это, конечно, мое мнение.
Массимо
Я хочу сказать, что каждое решение для хранения данных, которое вы можете получить сейчас, имеет интегрированную обработку файлов. EMC, HDS, IBM, HP, Netapp (очевидно), Dell. Вы не можете говорить о «SAN» (опять-таки, неправильном значении, поскольку на самом деле это то, что вы описываете как уровень связности), не говоря об обслуживании файлов. Не могли бы вы прыгнуть в комнату связи?
Василий
1
Мне нравится, как это получилось. Я думаю, что лучше сконцентрироваться на этом вопросе о том, что такое SAN, и упомянуть NAS только мимоходом. Этот старый вопрос о том, "в чем разница между SAN, NAS, DAS?" может быть немного обновлен и превращен в канонический Q & A самостоятельно.
Опека - Восстановите Монику

Ответы:

45

Прежде всего, для (широкого) сравнения хранилищ DAS, NAS и SAN см. Здесь .


Существует несколько распространенных заблуждений относительно термина « SAN », который означает « Сеть хранения данных » и поэтому, строго говоря , относится только к инфраструктуре связи, соединяющей устройства хранения (дисковые массивы, ленточные библиотеки и т. Д.) И пользователей хранилищ (серверы). ). Однако в обычной практике термин «SAN» используется для обозначения двух вещей:

  1. Полная инфраструктура хранения, включающая все аппаратное и программное обеспечение, обеспечивающее общий доступ к центральным устройствам хранения с нескольких серверов. Такое использование, хотя и не совсем корректное, является общепринятым, и на что ссылается большинство людей, говоря о «SAN». Остальная часть этого ответа будет сфокусирована на нем, описывая каждый компонент инфраструктуры хранения на уровне предприятия.
  2. Один массив хранения (см. Позже); как в «У нас есть SAN марки X с хранилищем 20 ТБ». Такое использование в корне неверно, поскольку оно даже не учитывает реального значения «SAN», а просто предполагает, что это некая форма устройства хранения.

Сеть SAN может состоять из очень разных аппаратных средств, но обычно может быть разбита на различные компоненты:

  • Массивы хранения : здесь хранятся данные (и то, что ошибочно называют «SAN» довольно часто). Они состоят из:
    • Физические диски: они, конечно, архивируют данные. Используются диски корпоративного уровня, что означает, что они обычно имеют меньшую емкость для каждого диска, но гораздо более высокую производительность и надежность; Кроме того, они намного дороже, чем диски потребительского класса. Диски могут использовать широкий спектр соединений и протоколов ( SATA , SAS , FC и т. Д.) И различные носители данных ( твердотельные диски становятся все более распространенными), в зависимости от конкретной реализации SAN.
    • Дисковые корпуса: это место, где размещены диски. Они обеспечивают электричество и передачу данных к ним.
    • Контроллеры / процессоры хранения: они управляют дисковым вводом-выводом, RAID и кэшированием (термин «контроллер» или «процессор» различается у разных поставщиков SAN). Опять же, используются контроллеры уровня предприятия, поэтому они имеют гораздо лучшую производительность и надежность, чем оборудование потребительского класса. Они могут и обычно настроены в паре для резервирования.
    • Пулы хранения : пул хранения - это группа пространства хранения, включающая несколько (часто много) дисков в конфигурации RAID. Он называется «пулом», поскольку его разделы могут быть выделены, изменены в размере и отменены по требованию, создавая LUN.
    • Логических устройств (LUN): ЛУН является кусок пространства , отбираемого от пула устройств хранения данных, который становится доступным ( «представленной») на одном или нескольких серверах. Это рассматривается серверами как объем хранения и может быть отформатирован ими с использованием любой файловой системы, которую они предпочитают.
  • Ленточные библиотеки: они могут быть подключены к SAN и использовать одну и ту же технологию связи как для подключения к серверам, так и для прямого резервного копирования с хранилища на ленту.
  • Сеть связи ( собственно «SAN» ): это то, что позволяет пользователям (серверам) хранилища получать доступ к устройствам хранения (массив (ы) хранения, ленточные библиотеки и т. Д.); это, строго говоря, реальное значение термина «Сеть хранения данных» и единственная часть инфраструктуры хранения, которая должна быть определена как таковая. На самом деле существует множество решений для подключения серверов к общим устройствам хранения, но наиболее распространенными являются:
    • Fibre Channel : технология, использующая оптоволокно для высокоскоростных соединений с общим хранилищем. Он включает в себя адаптеры главной шины , волоконно-оптические кабели и коммутаторы FC и может достигать скоростей передачи в диапазоне от 1 Гбит до 20 Гбит. Кроме того, многолучевой ввод-вывод можно использовать для группировки нескольких физических каналов, что обеспечивает более высокую пропускную способность и отказоустойчивость.
    • iSCSI : реализацияпротокола SCSI через IP-транспорт. Он работает на стандартномоборудовании Ethernet , что означает, что он может достигать скорости передачи от 100 Мбит (обычно не используется для сетей SAN) до 100 Гбит. Также можно использовать многопутевой ввод / вывод (хотя базовый сетевой уровень вносит некоторые дополнительные сложности).
    • Fibre Channel over Ethernet (FCoE) : технология между полным FC и iSCSI, которая использует Ethernet в качестве физического уровня, но FC в качестве транспортного протокола, что позволяет избежать необходимости в уровне IP в середине.
    • InfiniBand : очень высокопроизводительная технология подключения, менее используемая и довольно дорогая, но способная обеспечить некоторую впечатляющую пропускную способность.
  • Host Bus Adapters (HBAs): адаптерные карты, используемые серверами для доступа к уровню подключения; они могут быть выделенными адаптерами (как в FC SAN) или стандартными картами Ethernet. Существуют также адаптеры iSCSI HBA, которые имеют стандартное соединение Ethernet, но могут обрабатывать протокол iSCSI в аппаратном обеспечении, тем самым освобождая сервер от некоторой дополнительной нагрузки.

SAN предоставляет множество дополнительных возможностей для хранилища с прямым подключением (или с физическим разделением):

  • Отказоустойчивость: высокая доступность встроена в любую SAN корпоративного уровня и обрабатывается на всех уровнях, от блоков питания в массивах хранения до соединений с сервером. Диски более надежны, RAID используется для противостояния сбоям на одном или нескольких дисках, используются резервные контроллеры, а многопутевой ввод / вывод обеспечивает бесперебойный доступ к хранилищу даже в случае сбоя канала.
  • Большая емкость хранилища: сети хранения данных могут содержать много больших устройств хранения, что позволяет гораздо больше места для хранения, чем тот, который мог бы достичь один сервер.
  • Динамическое управление хранилищем: тома хранилищ (LUN) могут быть созданы, изменены и уничтожены по требованию; они могут быть перемещены с одного сервера на другой; выделение дополнительного хранилища для сервера требует только некоторых конфигураций, в отличие от покупки дисков и их установки.
  • Производительность: правильно сконфигурированная сеть SAN, использующая новейшие (хотя и дорогие) технологии, может достичь действительно впечатляющей производительности и изначально спроектирована для обработки высокой параллельной нагрузки с нескольких серверов.
  • Репликация на уровне хранилища: два (или более) массива хранилищ могут быть настроены для синхронной репликации, что позволяет полностью перенаправить серверный ввод-вывод от одного к другому в сценариях сбоев или аварийных ситуаций.
  • Снимки на уровне хранилища : большинство массивов хранилищ позволяют делать снимки отдельных томов и / или целых пулов хранения. Эти снимки могут быть восстановлены в случае необходимости.
  • Резервное копирование на уровне хранилища: большинство сетей SAN также позволяют выполнять резервное копирование непосредственно из массивов хранилищ в ленточные библиотеки, подключенные к SAN, полностью обходя серверы, которые фактически используют данные; Различные методы используются для обеспечения целостности и согласованности данных.

Исходя из всего вышесказанного, преимущества использования SAN очевидны; но как насчет затрат на покупку одного и сложности управления одним?

SAN - это оборудование корпоративного уровня (хотя для небольших сетей SAN может быть экономическим обоснованием даже в малых и средних компаниях); они, конечно, легко настраиваются, поэтому могут варьироваться от «пары ТБ с 1 Гбит iSCSI и несколько высокой надежностью» до «нескольких сотен ТБ с удивительной скоростью, производительностью и надежностью и полной синхронной репликацией в центр обработки данных DR»; затраты варьируются соответственно, но обычно выше (как в «общей стоимости», так и в «стоимости на гигабайт пространства»), чем в других решениях. Не существует стандарта ценообразования, но даже для небольших сетей SAN нередко иметь ценники в диапазоне от десятков тысяч (и даже сотен тысяч) долларов.

Разработка и внедрение SAN (особенно для высококлассного) требует определенных навыков, и эту работу обычно выполняют высокоспециализированные люди. Повседневные операции, такие как управление LUN, значительно упрощаются, но во многих компаниях управление хранением в любом случае осуществляется специально выделенным человеком или группой.

Независимо от вышеперечисленных соображений SAN являются предпочтительным решением для хранения данных, где требуются высокая емкость, надежность и производительность.

Massimo
источник
3
Проголосуйте ++ за такой подробный ответ.
Саймон Кэтлин
3

Вам нужен один? Зависит. £ или $ за туберкулез значительно выше, чем DAS. Кроме того, боюсь, что производительность DAS превосходит FC / AL и iSCSI SAN (по крайней мере, в моем тестировании с базами данных Oracle и SQL Server). Но с DAS вы не получаете преимуществ от возможности совместного использования хранилища (хорошо для кластеризации и VMWare).

Ряд поставщиков систем хранения данных переходят от волоконно-оптического канала к соединениям контроллера хост-хранилище в пользу iSCSI, который работает поверх Ethernet. Это старая сага Token-Ring против Ethernet; с таким большим количеством отраслевых исследований и инвестиций в Ethernet, FC просто не может идти в ногу. Коммутатор Ethernet 10 Гбит / с намного дешевле, чем коммутатор FC 8 Гбит / с, плюс он может быть vLANd или иным образом сегментирован для обеспечения хранения и хранения данных.

Тем не менее, есть некоторые большие преимущества сетей SAN:

  • Снимки SAN (точка восстановления во времени для сервера или набора серверов)
  • Локальная и внешняя репликация на уровне блоков (без участия хост-сервера, поэтому нет необходимости в программной репликации)
  • Прямое резервное копирование SAN - если ваша система резервного копирования может подключаться и работать с вашим SAN

Если вы планируете окунуть нос в воду общего хранилища, посмотрите на такие продукты, как комплект HP P4000.

Саймон Кэтлин
источник