Существует ли распределенная система SAN / Storage? [закрыто]

9

Как и во многих других местах, мы просим наших пользователей не сохранять файлы на свои локальные машины. Вместо этого мы рекомендуем размещать их на файловом сервере, чтобы другие (с соответствующими разрешениями) могли их использовать и чтобы файлы были должным образом сохранены.

В результате у большинства пользователей большие жесткие диски, которые в основном пусты. Сейчас 2010 год. Конечно, есть система, которая позволяет превратить это пустое пространство в виртуальную сеть хранения данных или библиотеку документов?

Я представляю себе клиентскую программу, которая передается на ПК пользователей и координируется с центральным сервером. Сервер выглядит для пользователей как обычный файловый сервер, но вместо того, чтобы хранить все содержимое файла, он просто сохраняет запись о том, где эти файлы можно найти среди различных пользовательских компьютеров. Затем он согласовывает с нужными клиентами, чтобы обслуживать запросы файлов. Клиентское программное обеспечение сможет отвечать на такие запросы напрямую, а также быть достаточно умным для локального кэширования последних файлов. Для обеспечения избыточности сервер может убедиться, что файлы копируются на несколько компьютеров, возможно, позволяя вам определять группы в разных местах, чтобы экземпляр всего хранилища находился в каждой группе, чтобы защитить себя от аварии в одном здании, уничтожая все остальное.

Очевидно, вы не указали бы здесь свой сервер базы данных, но для более простых вещей я вижу несколько преимуществ:

  • Файлы часто могут быть переданы с ближайшего (или локального ) компьютера.
  • Распределите сетевое подключение, а не собирайте все файлы, передаваемые по одному соединению
  • Дисковое пространство растет автоматически, как и ваша компания.
  • В конечном итоге должно быть дешевле, так как вам не нужно хранить отдельный набор дисков

Я также вижу несколько недостатков:

  • Время от времени ухудшается производительность ПК пользователя, если аппарат вынужден обслуживать или принимать передачу большого файла в течение загруженного периода.
  • Записи должны распространяться по сети несколько раз (хотя я подозреваю, что это не является большой проблемой, так как чтение в большинстве случаев происходит чаще, чем запись)
  • Тем не менее, необходимо время от времени отправлять полную копию данных за пределы площадки, и это затруднит проведение различий.

Думайте об этом как об облачной системе хранения, которая полностью живет в вашей корпоративной локальной сети и использует ваше существующее пользовательское оборудование.

Наш старый основной файловый сервер должен быть удален примерно через 2 года, и я собираюсь заменить его небольшим SAN. Наш текущий файловый сервер использует около 400 ГБ общего ресурса 1 ТБ. Мы сократили его только потому, что наше пространство для резервного копирования было ограничено. Я рассчитываю расширить как минимум до 4 ТБ полезного пространства при его замене, может быть, гораздо больше, если цены упадут так, как я ожидаю. Я думаю, что-то вроде этого было бы лучше. Как школа, у нас есть пара компьютерных лабораторий, которые я могу оставить работающими, что было бы идеально, чтобы добавить немного дополнительной избыточности в такую ​​систему.

За очень немногими исключениями, наши пользователи заполняют менее 40 ГБ своих жестких дисков объемом 120 ГБ, что означает, что я могу легко зарезервировать 65 ГБ на машину. И это будет только увеличиваться, так как новые машины будут поставляться с дисками на 250 Гб, и даже те, которые скоро могут быть больше. К тому времени, когда файловый сервер будет заменен, учитывая график замены настольных компьютеров, я ожидаю, что такая система позволит использовать 5 ТБ доступного хранилища, даже с учетом избыточности и истории.

К сожалению, самая близкая вещь, которую я могу найти, - это Dienst , и это всего лишь статья, датированная 1994 годом. Я просто использую неправильные модные слова в своих поисках, или это действительно не существует? Если нет, то есть ли у меня большой недостаток?

Джоэл Коэль
источник
1
Вместо того, чтобы покупать большие магнитные накопители, вы должны использовать твердотельные накопители меньшего размера вместо систем конечного пользователя.
Jftuga
Возможно, вы захотите взглянуть на CCNx, разработанный командой из Ван Якобсона в PARC. Связанный: проект SWIFT
the wabbit

Ответы:

3

Для меня это звучит так, как будто вы описываете AFS , наиболее распространенная реализация которой - OpenAFS . Основные концепции OpenAFS описаны здесь: http://docs.openafs.org/UserGuide/ch01.html#HDRWQ3 .

AFS это:

  • Распределенная. Файловая система на нескольких компьютерах, но все еще использует единое пространство имен, поэтому распределенная природа прозрачна для клиентского компьютера.
  • Избыточная. Файлы могут существовать одновременно на нескольких серверных узлах, поэтому потеря нескольких серверных узлов не приведет к недоступности каких-либо данных.
  • Масштабируемость. Очевидно, что некоторые реализации «Enterprise» охватывают до 25 000 узлов.
Insyte
источник
+1, вероятно, не соответствует его спецификации, хотя.
Warner
Чего не хватает? Я думал, что это будет идеально подходит. Или хотя бы подгонка на 90%.
Insyte
Ну, тот факт, что запуск сервера AFS в Windows не поддерживается, может иметь к этому отношение. docs.openafs.org/ReleaseNotesWindows/ch03s11.html
mfinni
Да. Это не совпадает с тем, что они говорят здесь: openafs.org/windows.html .
Insyte
1
это для клиентского программного обеспечения. Вы хотите, чтобы окно Windows подключалось к существующей общей папке AFS? Действуй. Вы хотите разместить общий ресурс AFS в Windows? Неподдерживаемый.
mfinni
2

Да, большие диски в настольных системах конечных пользователей трагически не используются, когда вы правильно используете централизованное хранилище. Ну что ж. Некоторые недостатки использования гипотетического сетевого распределенного настольного компьютера:

  1. Это должно было бы справиться с деградацией, вызванной отключением пользовательских машин. Кто-то не пришел сегодня и их машина выключена? Лучше надеяться, что документы там распространяются на включенные машины. Кто-то работает поздно вечером, и его машина - единственная, которая включена? Не повезло, прости. Если у вас тоже не скопировано все на настоящий файловый сервер - а потом, что вы получили?

  2. Все должно иметь хорошее шифрование - в противном случае документы босса, содержащие его план по выводу средств, или документ HR, показывающий зарплату каждого, реплицируются на машину почтового клерка Джимми. На котором он работает LimeWire. Видишь, куда это идет?

mfinni
источник
3
Кроме того: их производительность отстой, сеть не будет работать на максимальной скорости, сеть SAN отключается в вечерние часы, что отстой для техобслуживания. Скорее избавьтесь от дисков и загрузитесь с SAN;)
TomTom
1

Нечто подобное CleverSafe (имеет как открытые, так и коммерческие версии) может в основном делать то, что вы хотите, но управление очень ненадежными узлами может быть проблемой. CleverSafe обрабатывает многократные сбои узлов, но, возможно, недостаточно быстро для такого рода «постоянного оттока» узлов, который вы бы увидели, используя настольные компьютеры в качестве узлов хранения.

Я думаю, что есть аналогичные решения из научных статей, которые я читал в прошлом, но CleverSafe, похоже, является реальным рабочим продуктом, а не просто прототипом. Компания существует с 2004 года.

rmalayter
источник
1

SANsymphony 7.0 Storage Virtualization Software

ниже все цитируется с их сайта:

Основные характеристики

Независимый от устройства пул виртуальных дисков, синхронное зеркалирование (HA), высокоскоростное кэширование, асинхронная удаленная репликация, тонкое выделение ресурсов, автоматическое многоуровневое копирование, оперативные моментальные снимки, бесперебойная миграция дисков, непрерывная защита данных (CDP)

Тип доступа

Заблокируйте дисковый ввод-вывод через физическую или виртуальную сеть хранения данных. Доступ к файловой системе предоставляется по протоколам NFS / CIFS из базовой операционной системы Windows Server. Два метода доступа могут быть объединены для удовлетворения требований унифицированного хранилища (SAN / NAS) высокой доступности.

Поддерживаемые хост-среды

Компьютерные системы, работающие под управлением стандартных операционных систем Windows, включая (Windows Server 2000, 2003, 2008, Hyper-V, Windows XP, Windows 7), UNIX, HP-UX, Sun Solaris, IBM AIX, RedHat Linus, Suse Linux, Apple MacOs, VMware ESX / vSphere, Citrix XenServer,

Поддерживаемые диски (серверная часть)

Любые внутренние диски, внешние диски, внешние дисковые массивы, JBOD, твердотельные диски (SSD) и интеллектуальные системы хранения, поддерживаемые в Windows Server 2008, могут быть подключены к узлам DataCore. Они могут быть подключены напрямую или подключены к SAN.


Это то, что вы после, да?

Марк Лоуренс
источник
Не совсем. Это программное обеспечение по-прежнему захватывает каждую машину - у вас должны быть машины, на 100% выделенные для хранения. Я хотел бы увидеть кое-что, что работает в фоновом режиме на ПК, которые все еще развернуты с конечными пользователями, и использует преимущества уже имеющегося запасного диска.
Джоэл Коэль
Перечитывая абстракцию хранилища / метаданных, я видел это недавно, но это может быть скорее концептуальным, чем практическим подходом
Марк Лоуренс,
Конечно, стоит обратить внимание и на Windows DFS-R, если вы еще этого не сделали. При этом вы настраиваете пространство имен папок, доступ к которому и реплицируется прозрачно через репликацию AD. Папки пространства имен имеют цели для физических общих ресурсов, и их можно реплицировать с использованием топологии по вашему выбору (например, хаб и лучи или бесплатно для всех). Э-э, есть загвоздка, я думаю, что цели должны быть запущены Windows Server.
Марк Лоуренс
0

Самое близкое, что приходит мне в голову - это Googles MapReduce или бесплатная альтернатива Hadoop, но она предназначена для масштабирования в петабайтную область для действительно больших веб-приложений.

Как правило, ваш сценарий не является чем-то, что я действительно хотел бы опробовать, так как полагаю, что административные накладные расходы на управление машинами для этой дополнительной услуги намного превзойдут любые выгоды, которые вы можете получить от этого.

Кроме того, я вижу определенный риск того, что в Windows (или в любой другой ОС) могут возникнуть не обнаруженные проблемы, которые могут привести к уязвимости для быстро распространяющегося червя, который может уничтожить всю сеть за считанные минуты, независимо от того, как Надежно и безопасно ваши системы настроены, и это займет все ваши пулы хранения данных с ним.

Кроме того, я не совсем уверен, что свободные объемы дисков в клиентских системах будут продолжать расти, так как я предполагаю, что в будущем в Интернет будет перенесено еще много приложений, включая такие, как офисные приложения и даже Photoshop, что приведет к большой толчок для тонких клиентов (снова).

Свен
источник