вопрос
Я читал много дискуссий о хранении и о том, лучше ли SSD или классические HDD. Я довольно смущен. Жесткие диски все еще довольно предпочтительны, но почему?
Что лучше для активного хранения? Например, для баз данных, где диск постоянно активен?
О SSD.
Плюсы.
- Они тихие
- Не механический
- Самый быстрый.
Cons.
- Более дорогой.
Вопрос.
- Что происходит, когда используется жизненный цикл одной ячейки SSD? Диск уменьшен только на эту ячейку и работает нормально?
- Какую файловую систему лучше всего написать? Является ли ext4 хорошим, потому что он сохраняет в ячейках последовательно?
О HDD.
Плюсы.
- Дешевле.
Cons.
- В случае механической неисправности, я думаю, что обычно нет способа ее починить. (Пожалуйста подтвердите.)
- Самый медленный, хотя я думаю, что скорость HDD обычно достаточна для серверов.
Это просто о цене? Почему предпочтительны жесткие диски? И действительно ли SSD полезны для серверов?
hard-drive
storage
hardware
ssd
genderbee
источник
источник
Ответы:
Одним из аспектов моей работы является проектирование и создание крупномасштабных систем хранения данных (часто называемых «SAN» или «Сети хранения данных»). Как правило, мы используем многоуровневый подход с SSD и HDD вместе взятыми.
Тем не менее, у каждого есть определенные преимущества.
SSD почти всегда имеют более высокую цену за байт. Я могу получить 10k жестких дисков SAS 4kn с ценой за гигабайт в размере $ 0,068 / ГБ USD. Это означает, что примерно за 280 долларов я могу получить диск объемом 4 ТБ. С другой стороны, твердотельные накопители обычно имеют цену за гигабайт в 10 и 20 центов, даже в долларах за гигабайт.
При работе с RAID скорость становится менее важной, а размер и надежность важнее. Я могу создать RAID-систему N + 2 емкостью 12 ТБ с жесткими дисками, намного дешевле, чем с твердотельными накопителями. Это в основном связано с пунктом 1.
При правильном обращении жесткие диски очень дешевы в замене и обслуживании. Поскольку цена за байт ниже, замена жесткого диска на другой из-за сбоя обходится дешевле. А поскольку сбои жесткого диска обычно связаны со временем и записью данных, его замена не приводит к автоматическому запуску TBW при перестройке массива RAID. (Конечно, процентное соотношение TBW, использованное для восстановления, в целом ничтожно, но точка зрения остается в силе.)
Рынок SSD относительно сложен. Существует четыре (текущих, на момент написания этой статьи) основных типа твердотельных накопителей, рассчитанных на наибольшее количество поддерживаемых операций записи на наименьшее: SLC, MLC, TLC, QLC. SLC обычно поддерживает наибольшее количество общих записей (основной ограничивающий фактор времени жизни SSD), тогда как QLC обычно поддерживает наименьшее количество общих записей.
Тем не менее, самые успешные системы хранения данных, которые я видел, связаны с использованием обоих используемых дисков. Лично все системы хранения, которые я рекомендую клиентам, обычно соответствуют следующим уровням:
Производительность чтения / записи падает при увеличении уровней, данные распространяются вниз до уровня, где большая часть данных имеет одинаковую частоту доступа / изменения. (То есть, чем чаще данные читаются / записываются, тем выше уровень, на котором они находятся.)
Добавьте туда хорошо спроектированный оптоволоконный канал, и вы действительно сможете создать сеть SAN, которая будет иметь более высокую пропускную способность, чем встроенные диски.
Теперь к некоторым конкретным предметам, которые вы упоминаете:
Ваши вопросы по SSD
Ваши HDD Вопросы
источник
Это? Я не уверен, что это честно.
Жестких дисков бывают больших размеров для достойной цене прямо сейчас, это неоспоримо, и я думаю, что люди доверяют им в течение более длительного хранения данных, чем SSD, тоже. Кроме того, когда твердотельные накопители умирают, они стремятся умереть полностью, все за один раз, тогда как жесткие диски стремятся умереть более предсказуемым образом, что, возможно, дает больше времени для извлечения данных в первую очередь, если это необходимо.
Но в остальном SSD - это путь вперед для большинства применений - вам нужна загрузочная пара, пара 500-гигабайтных SATA в R1 не будет стоить земли, для использования БД вы не сможете по-настоящему побить SSD (пока ваши логи включены) в любом случае высокопрочные модели). Для резервных копий, да, вы можете использовать большие 7,2 КБ жестких дисков, то же самое для очень больших наборов данных (на самом деле я купил более 4 000 10 ТБ жестких дисков в начале прошлого года именно для этого требования), но в остальном SSD - путь вперед.
источник
Твердое состояние для всего горячего: интерактивное использование, базы данных, все что угодно в Интернете Шпиндели как дешевое теплое хранилище, только для не совсем холодных архивов или редко используемых данных. В частности, жесткие диски в промежуточной области перед резервным копированием архивируются на ленту.
Различные типы носителей для горячего и холодного также помогают с некоторым разнообразием. Недостаток потери данных в контроллере SSD марки был бы намного хуже, если бы он брал как онлайн, так и данные резервного копирования. Маловероятно, но шпиндели и лента все равно дешевы, так зачем рисковать.
Режим отказа любого конкретного устройства не важен, если массивы остаются избыточными и резервными. Обычно процедура заключается в замене диска с признаками неисправности. Поэкспериментируйте с ремонтом в ваших тестовых системах, где любой катастрофический сбой не влияет на производственные услуги.
Файловая система - это вопрос личных предпочтений. Хотя существуют оптимизированные для SSD файловые системы, кое-что, что вы знаете и можете починить, может быть более важным.
источник
Большим преимуществом SSD является скорость и надежность, однако один из грязных маленьких секретов - ограниченное количество циклов записи, которыми обладает SSD. Если вы создаете сервер, который выполняет много операций записи на жесткий диск, например сервер базы данных или почтовый сервер, вам понадобится более дорогой твердотельный накопитель с более высокой стойкостью.
NAND Flash имеет 3 типа
TLC в основном предназначен для веб-серверов или серверов архивации, которые имеют мало циклов записи. MLC предназначен для серверов, которые имеют сочетание циклов чтения и записи, таких как серверы баз данных с малым объемом. SLC предназначен для серверов с большим количеством циклов чтения / записи, таких как сервер базы данных большого объема.
Основным движущим фактором между SSD и HDD является приложение и бюджет. В идеальном мире жесткие диски SLC SSD сделали бы стандартный HDD устаревшим, но мы просто еще не пришли.
источник
Это зависит от того, с кем вы разговариваете, от их опыта (управление, ИТ, продажи и т. Д.) И от того, на каком сервере идет речь. Жесткие диски обычно на порядок дешевле на байт, но потребляют больше энергии и почти всегда работают медленнее, в зависимости от рабочей нагрузки.
Почти всегда это сводится к стоимости и к тому, сколько памяти можно разместить на данном количестве серверов. Если вы можете получить производительность 5-дискового RAID-массива с одним SSD, SSD, вероятно, будет намного дешевле и потребляет немного энергии, но вы также получите, возможно, 1/10 хранилища.
Именно здесь все усложняется, и поэтому многие люди пропускают сложность и просто идут с жесткими дисками, которые они знают.
Твердотельные накопители бывают разных классов с ограничениями по количеству данных, которые могут быть записаны в ячейки, что НЕ совпадает с объемом данных, записываемых хостом. Запись небольших объемов данных приводит к записи больших объемов в ячейки, это называется усилением записи и может быстро убивать диски с низким уровнем выносливости.
Ячейки SSD названы по количеству битов, которые они могут хранить, чтобы хранить n-бит, им нужно 2 ^ n уровней напряжения на ячейку. TLC (тройной бит) требует 8 уровней напряжения для адресации этих битов. Как правило, каждый раз, когда вы увеличиваете уровень бит на ячейку, вы получаете снижение прочности ячейки в 3-10 раз. К примеру , СЖК привод может написать все ячейки , 100000 раз , прежде чем клетки умирают, предприятие eMLC 30000 раз, MLC 10000, TLC 5000, QLC 1000.
По словам аналитика Джима Хэнди, технология сотовых ячеек SSD на поколениях улучшена, улучшенная литография и 3D NAND улучшают плотность и производительность по сравнению со старыми 2D NAND. «Сегодня MLC лучше, чем вчерашний SLC» .
SSD на самом деле не пишут напрямую в адресуемые ячейки, они пишут в блоки ячеек. Таким образом, блок имеет более постоянное количество записей в ячейках, и когда ячейки выходят за допустимые пределы, весь блок помечается как плохой, и данные перемещаются в новый блок. Выносливость SSD зависит от типа ячейки, количества свободных блоков, количества служебных данных для исправления ошибок и от того, как накопитель использует кэширование и алгоритмы для уменьшения усиления записи. Также вступает в силу допуск, который производитель выбирает для обозначения плохих дисков: корпоративный диск будет отмечать блоки как плохие раньше, чем потребительский диск, даже если один из них все еще полностью функционален.
SSD-накопители корпоративного уровня с высокой записью основаны на ячейках SLC или eMLC и имеют большое количество запасных блоков и обычно имеют большой кэш с конденсаторами, чтобы обеспечить сброс кэш-памяти на диск при потере питания.
Существуют также накопители с гораздо более низкой выносливостью для приложений с высоким уровнем чтения, таких как файловые серверы, которым требуется быстрое время доступа, они стоят дешевле на байт за счет снижения выносливости, с разными типами ячеек, меньшим количеством свободной области и т. Д. может иметь только 5% выносливости диска с «высокой записью», но они также не нуждаются в нем при правильном использовании.
Моя база данных небольшая, с периодическим чтением, составляющим 95% доступа, и большая ее часть кэшируется в ОЗУ, на жестком диске она работает почти так же быстро, как и на SSD. Если бы он был больше, в системе было бы недостаточно оперативной памяти, и SSD начинает сильно влиять на время доступа.
Твердотельные накопители также ускоряют резервное копирование и восстановление. Моя БД восстановилась из резервной копии примерно за 10 минут на медленный SSD или около 11 секунд на очень быструю, резервное копирование на жесткий диск заняло бы около 25 минут. Это по крайней мере 2 порядка, и это может иметь огромное значение в зависимости от рабочей нагрузки. Он может буквально окупить себя в первый день.
Базы данных с огромным количеством небольших записей могут убить диск TLC потребительского уровня за считанные часы.
Безусловно, если для приложения выбраны правильный тип и класс привода, если вы сделаете это неправильно, это может привести к катастрофе.
На моем сервере работает несколько баз данных, плюс сетевое хранилище с высокой степенью чтения, плюс хранилище видеороликов с высокой степенью защиты при записи, а также хранилище смешанных файлов с возможностью чтения и записи и клиентское резервное копирование. На сервере имеется массив жестких дисков RAID-6 для хранения больших объемов данных в сети и NVR, один высокопроизводительный SSD MLC для MySQL и три пользовательских накопителя TLC в RAID-5 для резервного копирования клиентов и баз данных и сетевого хранилища быстрого доступа.
Скорость записи на SSD RAID примерно такая же, как на HDD RAID, но скорость чтения с произвольным доступом более чем в 10 раз выше на SSD RAID. Опять же, это потребительский твердотельный накопитель TLC, но поскольку скорость последовательной записи примерно в 3 раза выше, чем у гигабитной локальной сети, она никогда не перегружается, и возникает много издержек, если система выполняет локальное резервное копирование при удаленном доступе.
Большинство твердотельных накопителей также предлагают мгновенное безопасное стирание (ISE) , которое может стереть данные за несколько секунд, по сравнению со многими часами или днями для жестких дисков, которые не имеют такой функции, только несколько жестких дисков корпоративного уровня предлагают ISE, но они становятся чаще. Это очень полезно, если вы удаляете или переделываете диск.
Зависит от типа данных и типов функций файловой системы, которые вы хотите. Я использую только EXT4 и BTRFS (нужны снимки и контрольные суммы). Затраты на файловую систему уменьшат используемое пространство и могут немного сократить срок службы твердотельных накопителей, BTRFS имеет большие накладные расходы на контрольные суммы и другие функции, а снимки будут занимать много места.
Независимо от типа диска, вам когда-нибудь приходилось восстанавливать данные на неисправном диске? Это может быть очень дорого , лучше иметь многоуровневую резервную копию, RAID на главном хранилище, резервные копии на локальном компьютере на другом устройстве или машине, а затем синхронизировать их с удаленным сайтом или облаком. 1 ТБ облачного хранилища стоит 5 долларов в месяц, восстановление данных на жестком диске может стоить вам 2 тыс., А восстановление мертвого SSD может оказаться невозможным ... просто сделайте резервные копии и забудьте о ремонте.
источник
И ТО И ДРУГОЕ.
Я еще не видел SSD, умирающий из-за нагрузки записи (в этом случае предполагается, что они станут доступны только для чтения). Не то чтобы они не умирали по другим причинам - включая, но не ограничиваясь, перегревом и ошибками прошивки.
И я видел мертвый HDD. На самом деле их намного больше.
Так много о надежности.
В некоторых случаях имеет смысл сделать смешанный RAID1 (HDD + SSD). Таким образом, вы можете хеджировать режимы сбоя, связанные с ними обоими, и при этом иметь производительность чтения SSD.
В других случаях имеет смысл использовать SSD только для журнала файловой системы - вы в два раза увеличите производительность записи на жесткий диск (поскольку вы экономите половину операций записи и половину запросов) и, как правило, не рискуете, даже если ваш SSD-диск используется неправильно. плашки. Ext4 теряет свой журнал довольно изящно.
источник
data=ordered
. Вы не «сохраняете половину записей», если ваша рабочая нагрузка включает только переименование и удаление файлов / каталогов, а также создание пустых файлов. Но да, журнал на SSD должен значительно загружать большинство рабочих мест, удаляя множество мелких записей.Два основных фактора, которые следует учитывать:
Твердотельные накопители вытесняют жесткие диски из воды с точки зрения производительности. Если вам нужна высокая пропускная способность и низкое время доступа, ничто не сравнится с твердотельными накопителями .
Но стоимость гигабайта SSD намного выше, чем у HDD. Если вам нужно много памяти, а пропускная способность или время доступа менее важны, ничто не сравнится с жесткими дисками.
Цифрам пропускной способности (пропускной способности) может помочь соответствующий уровень RAID (однако, не так много времени доступа, если только ваши диски не засорены настолько, что возникнут проблемы с очередями).
Считывание времени доступа для небольших наборов данных может быть обеспечено путем соответствующего кэширования (т. Е. Увеличения объема оперативной памяти на сервере). Тем не менее, это не поможет при записи (за исключением кэшей ОЗУ с резервным питанием от батареи в контроллерах или дисках).
Так что все действительно зависит от вашего варианта использования. Сервер резервного копирования / архивирования, который требует большой емкости, но не заботится о времени доступа или пропускной способности, будет лучше использовать жесткие диски. Сервер базы данных с большим трафиком предпочтет SSD. Между ... зависит.
Какой бы ни была ситуация:
Вам нужны резервные копии. Дело не в том, что диск (SSD или HDD) выйдет из строя, а в том, когда .
Если сервер имеет какое-либо значение, вам нужен какой-то RAID, чтобы поддерживать работоспособность и защищать данные. RAID также обычно помогает с производительностью. Что во многом зависит от ваших требований (опять же, компромисс между производительностью и стоимостью).
источник
Как уже упоминалось, большая разница в цене за ГБ в сравнении со случайной производительностью ввода-вывода.
Взять, к примеру, Seagate Exos 16 ТБ: при цене ~ 550 $ он составляет 0,034 $ / ГБ. Теперь сравните его с Micron 5200 ECO 7,68 ТБ начального уровня по цене ~ 1300 долларов США, с итоговым соотношением 0,14 доллара США / ГБ: жесткий диск в 5 раз дешевле, а также в 2 раза больше. С другой стороны, производительность произвольного ввода-вывода SSD была значительно выше, и в этом есть одна загвоздка: потребительские твердотельные накопители, в которых отсутствует кэш-память обратной записи с защитой от потери мощности, работают довольно медленно (иногда даже медленнее, чем HDD) для синхронизированной рабочей нагрузки с синхронизированными случайными ввода-выводами (например, базы данных, виртуальные машины). ). Это очень важный момент, который редко анализируется онлайн-обзорами. Корпоративные твердотельные накопители с почти универсальным использованием конденсаторов в качестве защиты от потери мощности не страдают от этого недостатка, имея очень высокий случайный ввод-вывод для чтения и записи.
Из вышесказанного можно понять, почему SSD убили диски SAS 15K и 10K класса high-end: они обеспечивают гораздо лучшую производительность при сопоставимой стоимости (диски 15K были особенно дорогими). С другой стороны, 7,2 тыс. Жестких дисков имеют очень прочные позиции в системах хранения большой емкости.
Intel Optane (который основан на Xpoint, а не на NAND) относится к своему классу как по скорости, так и по долговечности, предлагая очень высокую цену / ГБ: 100 ГБ Optane P4801x стоит более 260 $, а стоимость за ГБ составляет > 2.6 $, что в 80 раз больше по сравнению с жесткими дисками. По этой причине его часто используют в качестве «ускорителя приложений» или в качестве устройства журнала / журнала.
По этим причинам современные SAN и серверы часто используют многоуровневую или кэшированную подсистему хранения:
Многоуровневые системы помещают горячие данные в быстрый уровень (SSD) и холодные данные в медленный уровень (HDD). В таких системах общее пространство хранения является суммой быстрого и медленного уровня; однако они статически разделены - если холодные данные внезапно становятся горячими, вам нужно подождать, пока они не будут перемещены на быстрый уровень. Более того, быстрый уровень должен быть таким же долговечным, как и медленный;
система на основе кеша имеет все данные на медленном HDD, дополненном динамическим кешем на SSD, куда горячие данные копируются (а не перемещаются); это означает, что такие системы имеют общее пространство хранения, равное тому, что предлагает медленный уровень, но с дополнительной гибкостью динамического кэша. В системах на основе кэша быстрый уровень может быть сформирован недорогими дешевыми твердотельными накопителями.
Какая файловая система лучше всего подходит для флеш-накопителей? Наивным ответом может быть «тот, кто пишет меньше», но реальность такова, что любая продвинутая технология файловой системы основана на подходе CoW, который, основываясь на конкретной реализации, может привести к довольно существенному усилению записи (то есть: ZFS и WALF будем писать больше, чем, скажем, EXT4 или XFS). С чистой точки зрения «без записи», я думаю, что трудно превзойти EXT4 и XFS (особенно, когда поддерживается lvmthin , что позволяет делать быстрые снимки даже в этих классических файловых системах); однако мне очень нравится дополнительная гарантия защиты данных и сжатие lz4, предоставляемое ZFS.
Итак, вам действительно нужно хранилище SSD для работы на сервере? По-разному:
если вам нужно дешево хранить несколько ТБ данных, лучше использовать жесткие диски (или, как правило, дешевые потребительские твердотельные накопители);
если у вас в основном последовательная рабочая нагрузка (например, файловый сервер), вам не нужны SSD;
если ваша рабочая нагрузка является случайной IO, вы получите большую выгоду от SSD;
Если у вас есть шаблон записи с интенсивным fsync, корпоративные твердотельные накопители (или мощный RAID-контроллер с защищенным от потери данных кэшем обратной записи) - ваш лучший выбор с недостатком высокой стоимости.
источник
Простой ответ здесь: используйте твердотельные накопители для быстрых данных о производительности, например, при создании сервера для выполнения больших и быстрых операций с данными (например, редактирования видео)
Используйте HHD для медленного архивного хранения.
Как правило, жесткие диски менее надежны, чем твердотельные накопители, даже несмотря на то, что они дешевле, чем твердотельные накопители.
если хранятся конфиденциальные данные, рассмотрите возможность использования ssd, а также жесткого диска для резервного копирования.
источник
Тихо не всегда хорошо. Как электрические машины на дороге слишком тихо. Шумы при доступе к жесткому диску могут обеспечить безопасность (как я обнаружил взлом сервера выполнения работ во время просмотра фильма. (Дополнение: принтеры с переводом строки, связанные с / var / log / messages, сложнее удалить из одной записи)
источник
Я смотрю на это так,
Для какой службы я создаю сервер?
Если это инфраструктурный сервис, такой как LDAP / AUTH / Printing и т. Д., В котором вы предлагаете сервис, это в основном проблема с памятью, экономия денег и использование жесткого диска (7,2 тыс. Или 10 тыс., Может быть, загрузочного устройства RAID 1 с SSD) и нагрузка на него памяти. ,
Убедитесь, что для файлового сервера используется контроллер флэш-рейдов с резервным питанием от батареи. После этого вы можете эффективно использовать жесткие диски, записывая их на контроллер, а не на диски.
Если это база данных службы данных и т. Д., Тогда используйте SSD-рейд для высокой пропускной способности, но контролируйте затраты с помощью жесткого диска, например, для некоторых БД не потребуется высокая скорость записи или просто не будет запускаться IOP, чтобы гарантировать использование дорогостоящего хранилища.
В конце концов, дело за деньгами и финансовым директором / финансовым директором / вице-президентом.
источник
Твердотельные накопители, безусловно, являются лучшими, они станут лучше и будут продолжать дешеветь, но сегодня они дороже.
Жесткие диски подходят для последовательных задач хранения:
Жесткие диски также хороши для задач, нечувствительных к задержке:
Так что для сервера, если у вас есть бюджет, вы можете заполнить его твердотельными накопителями. Кроме того, используя неполный список выше, вы можете сэкономить деньги, смешивая с жесткими дисками.
RAID, и Tiering выходит за рамки этого вопроса, я уверен, что есть много других вопросов по этому поводу.
Что касается жизненного цикла твердотельных накопителей (я помню, что чтение Samsung Evo Pro (потребительского продукта) продлилось намного дольше, чем обещалось). Отдельные ячейки могут, конечно, со временем сломаться, но это не сломает весь диск. Время жизни ячейки связано с количеством записей. на этой камере. Контроллер SSD распределяет записи по нескольким ячейкам с течением времени. Если твердотельный накопитель заполнен на 99%, а оставшееся пространство используется с большим количеством записей, то оставшееся пространство будет изнашиваться быстрее.
источник
Если есть необходимость
тогда HDD более надежен
Перезапись в SSD медленнее
SSD потрясающий!
это сделало революцию физического хранения exabytes / yotabytes в одном маленьком кабинете / стойке
Может быть установлен большой азотный кулер, а небольшое пространство может служить чистой стойкой для хранения
SSD Cache - еще одна удивительная технология быстрого чтения, которая позволяет кэшировать на новый уровень
источник