Я настраиваю сервер Linux на хосте ESX 4.1. Этот сервер должен иметь несколько ТБ данных, хранящихся на нем. В настоящее время мы обсуждаем, стоит ли использовать LVM. В настоящее время мы считаем, что лучше всего иметь несколько томов по 2 ТБ (ограничение ESX), монтируемых на отдельные тома как таковые.
/disk1 - 2TB
/disk2 - 2TB
/disk3 - 2TB
Мы будем хранить каталоги размером от 100 до 400 ГБ. Эти каталоги должны храниться целиком и не могут быть разделены. Беспокойство заключается в том, что будет много потерянного пространства, если мы в конечном итоге будем хранить 1,7 ТБ на / disk1 и нам потребуется дополнительно 400 ГБ. В этом случае нам нужно будет сохранить каталог 400 ГБ на / disk2, оставив 300 ГБ неиспользованным.
Одним из решений этой проблемы является LVM, настроенный как:
--------
Disk 1 |
|
Disk 2 |---->/disk
|
Disk 3 |
--------
Однако мы застряли на одном простом вопросе. Что произойдет, если диск 2 выйдет из строя?
В первом сценарии очевидно, что произойдет, если диск 2 выйдет из строя, / disk2 больше не будет доступен.
В настройке LVM, если диск 2 выйдет из строя, будет ли он аналогичным (как, например, только те данные, которые были сохранены на диске 2, более недоступны) или все данные на / диске больше не будут доступны?
источник
Ответы:
Вы пропустили ряд важных концепций абстракции, которые поставляются с LVM. Логические тома не обрабатывают диски - они размещаются в группах томов. VG, в свою очередь, состоят из физических томов, которые могут быть дисками. Короче говоря, VG не сможет найти отсутствующий PV - то есть отсутствующий диск, поэтому вы не сможете получить доступ к логическим томам в группе.
Существуют процедуры восстановления , но обычно в виртуализированной среде вы все равно увидите доступность «все или ничего» - все файлы на диске будут содержаться в одном каталоге, который либо доступен со всем своим содержимым, либо вообще не доступен (если хранилище данных недоступно, например).
Что касается эффективности хранения, рассмотрите возможность использования тонкой подготовки - «неиспользуемое» пространство не заявлено в хранилище данных. Однако это происходит за счет более высоких административных издержек.
источник