Zip, Rar, 7z, Gzip, BZip2, Tar и т. Д. Я слышал, что 7z - аромат месяца, почему? Это лучше для всех ситуаций или есть лучший выбор для конкретных ситуаций.
Или, может быть, настоящий архиватор файлов, т.е. WinZip, WinRar, 7Zip и т. Д. (В отличие от формата), имеет больший эффект?
В своем ответе вы могли бы описать, какой компромисс между скоростью и сжатием использует ваш упомянутый формат.
Пожалуйста, предоставьте ссылки на любые эмпирические тесты, которые подтверждают ваш ответ.
Предыстория: мне нужно создать резервную копию пользовательского поискового индекса, который создает около 3000 относительно небольших файлов (менее 10 МБ), каждый из которых содержит много повторяющихся данных.
(Как обычно, в Википедии есть соответствующая статья, но раздел сравнения производительности является кратким.)
Спасибо
источник
Рекомендуемое чтение:
Сжатие файлов в многоядерную эпоху (Джефф Этвуд, также известный как CodingHorror, февраль 2009 г.)
А что касается алгоритмов:
источник
Это не все об эффективности и скорости. Конечно, они важны, и вы можете взглянуть на их тесты и мудро выбрать их из возможных вариантов (хотя я бы порекомендовал провести собственный сравнительный анализ с вашими данными на вашем собственном сервере). Но в какой-то момент архивирование неизбежно приводит к повторному доступу к вашим данным (иначе почему бы просто не удалить их?). Или, может быть, спустя годы вы будете иметь доступ не к данным, а к кому-то третьему лицу. Выберите то, что будет рядом, когда вам понадобится доступ к данным, и то, что люди узнают. Я лично использую 7zip, но когда я архивирую файлы, которые могут понадобиться другим, я использую zip. Они знают это, многие инструменты могут справиться с этим. Это может быть не так быстро или совсем не так мало, но это помогает с человеческим фактором.
источник
Кажется, что lzma очень хорошо работает как по степени сжатия, так и по скорости.
В следующих http://tukaani.org/lzma/benchmarks тестах самая быстрая настройка lzma давала времена сжатия значительно быстрее, чем самая быстрая опция bzip2, и в то же время давала сжатие лучше, чем самая медленная опция bzip2:
Особенно хорошо он работает с двоичными данными, но я думаю, что прочитал некоторые тесты простого текста, где bzip2 превзошел его.
Справочная страница lzma стоит прочитать:
источник
Взгляните на эту запись в Википедии . Внизу «Сравнение эффективности». Это даст вам процент сжатия и время, потраченное примерно. Все эти цифры будут варьироваться (в зависимости от скорости) в зависимости от скорости используемой машины, объема памяти и т. Д.
Больше тестов сжатия:
источник
Сравнивая zip, 7z, rar с двумя чехлами
Это зависит от того, что именно вы сжимаете, но в целом 7z лучше использует несколько процессоров, а сам формат сжатия 7z обеспечивает более высокое сжатие, чем zip, а иногда и больше, чем rar (хотя rar и 7z почти эквивалентны, но rar isn не свободен ...)
Мои тесты несколько месяцев назад дали такие результаты:
Сжатие одного файла базы данных с доступом 10 МБ:
Сжатие папки, содержащей более девяти тысяч файлов различных типов (903 488 КБ), и получение следующего (это комбинация исходного кода и всех инструментов, окружающих его для разрабатываемого программного обеспечения):
На время это было на Core2 Duo, 2 ГГц, 1 ГБ оперативной памяти и дешевом жестком диске.
Таким образом, 7z дал существенное улучшение в степени сжатия в двух случаях, которые я тестировал выше и выше zip, и даже улучшил rar, но 7z был, конечно, медленнее. Не так значительно, но достаточно, чтобы отметить.
-Адам
источник
Я только что установил Дар (но еще не имел возможности поиграть с ним). Это похоже на tar со сжатием gzip или bzip2, с дополнительной возможностью разбивать архив на несколько частей и вычислять четность так, чтобы, если одна или несколько частей были повреждены, ее можно было восстановить из файлов четности.
источник