xz не просто медленнее, но гораздо медленнее, файл 300 Мб занял около 30 секунд для сжатия bzip2. Я убил XZ после его сжатия в течение более 5 минут
Теб
@ Копать_Шо_я_нашел Я думаю, это сильно зависит от выбранного вами уровня сжатия. При этом -1он не такой медленный, но с настройками по умолчанию он довольно медленный.
glglgl
7
Последнее обновление maximumcompression.com - июнь-2011 (ответ обновлен в октябре-2015).
Поэтому на этом веб-сайте не упоминается
действующий текстовый компрессор в мире :
Сжатие Калгари 17,6% 14 файлов корпуса Калгари (tar-файл 3 ГБ)
Приз Хаттера
15.7% -ное сжатие текстового файла enwik8 объемом 100 МБ
(ноcmixэто не победитель, потому что требует слишком много оперативной памяти, более 20 ГБ)
Детали: Байрон Нолл активно развиваетсяcmix в Libre программного обеспечения (GPL) с 2013 года на основе книги сжатия данных Разъяснения по Мэтту Махони . Мэтт Махони также поддерживает некоторые из вышеперечисленных тестов и предлагает ZPAQ ( WP ), инкрементный архиватор командной строки.
Если вы предпочитаете более стандартный инструмент (требующий меньше оперативной памяти), я рекомендую:
lrzipэто эволюция rzipот Коливас . lrzipобозначает два имени: Long Range ZIP и Lzma RZIP . lrzipчасто лучше чем xz(другой популярный инструмент сжатия). Александр Риччио также рекомендует lrzip.
«Архиватор эксперт» , Мэтт Махони , интенсивно работал над PAQ алгоритмами в течение десяти лет и обеспечивает наилучший компромисс между CPU / ресурсами памяти и уровнем сжатия.
Тем не менее, последняя zpaqверсия не часто упаковывается / доступна в последних дистрибутивах :-(
Я всегда компилирую ее из источников, когда у меня новая машина, и мне нужен очень хороший компрессор: https://github.com/zpaq/zpaq
У bz2 сжатие более жесткое, в алгоритме есть больше вариантов поиска избыточности для сжатия.
В gzip гораздо больше инструментов и больше кроссплатформенности. Другие инструменты Windows могут работать с файлами .gz. Это часть http, так что даже веб-браузеры могут это понять.
В Linux есть инструменты, которые позволяют вам работать непосредственно со сжатыми файлами. zgrep и bzgrep могут искать в сжатых файлах.
Если бы только в Linux, я бы использовал bzip2, для немного лучших коэффициентов сжатия.
xz сжимает намного лучше, чем bz2, но занимает больше времени. Итак, если ваша цель - максимальное сжатие, а пространство на вашем жестком диске выше (это мой случай с одним заполненным диском на 98% - в то время как я реорганизую свои файловые системы), и вы можете запустить сценарий, чтобы выполнить работу - сделать перерыв и вернуться через 5 минут.
В моем опыте unxz очень быстро распаковывается, и это хорошо для меня каждый день.
bz2 быстрее сжимается, чем xz, но, похоже, не достигает результатов сжатия xz.
Единственный способ сделать эти оценки - запустить тесты для набора общих файлов, которые вы обычно сжимаете / распаковываете, и варьировать параметры, чтобы увидеть, что выходит впереди.
Ответы:
Как правило, bz2 имеет лучшую степень сжатия в сочетании с лучшими функциями восстановления.
OTOH, GZ быстрее.
Говорят, что xz даже лучше, чем bz2, но я не знаю, каково время.
источник
-1
он не такой медленный, но с настройками по умолчанию он довольно медленный.Последнее обновление maximumcompression.com - июнь-2011 (ответ обновлен в октябре-2015).
Поэтому на этом веб-сайте не упоминается
действующий текстовый компрессор в мире :
cmix
Соревнования / контрольные показатели:
18,2% сжатие текстового файла 1 МБ enwik6
Сжатие Калгари 17,6% 14 файлов корпуса Калгари (tar-файл 3 ГБ)
15.7% -ное сжатие текстового файла enwik8 объемом 100 МБ
(но
cmix
это не победитель, потому что требует слишком много оперативной памяти, более 20 ГБ)15,7% 202 МБ Silesia corpus
сжатия большого текста 12,4% сжатия текстового файла 1 ГБ enwik9
Детали:
Байрон Нолл активно развивается
cmix
в Libre программного обеспечения (GPL) с 2013 года на основе книги сжатия данных Разъяснения по Мэтту Махони . Мэтт Махони также поддерживает некоторые из вышеперечисленных тестов и предлагает ZPAQ ( WP ), инкрементный архиватор командной строки.Если вы предпочитаете более стандартный инструмент (требующий меньше оперативной памяти), я рекомендую:
lrzip
lrzip
это эволюцияrzip
от Коливас .lrzip
обозначает два имени: Long Range ZIP и Lzma RZIP .lrzip
часто лучше чемxz
(другой популярный инструмент сжатия).Александр Риччио также рекомендует
lrzip
.Мой любимый:
zpaq
«Архиватор эксперт» , Мэтт Махони , интенсивно работал над PAQ алгоритмами в течение десяти лет и обеспечивает наилучший компромисс между CPU / ресурсами памяти и уровнем сжатия.
Тем не менее, последняя
zpaq
версия не часто упаковывается / доступна в последних дистрибутивах :-(Я всегда компилирую ее из источников, когда у меня новая машина, и мне нужен очень хороший компрессор: https://github.com/zpaq/zpaq
источник
Может быть, вы могли бы взглянуть на эти тесты , особенно часть, тестирующую сжатие файлов журнала .
источник
я сделал тест для тестирования, чтобы сжать следующее:
204MB папка (с 1600 файлами HTML)
результаты
так что 7zip - лучший среди них, вы можете получить его здесь
http://www.7-zip.org/
источник
У bz2 сжатие более жесткое, в алгоритме есть больше вариантов поиска избыточности для сжатия.
В gzip гораздо больше инструментов и больше кроссплатформенности. Другие инструменты Windows могут работать с файлами .gz. Это часть http, так что даже веб-браузеры могут это понять.
В Linux есть инструменты, которые позволяют вам работать непосредственно со сжатыми файлами. zgrep и bzgrep могут искать в сжатых файлах.
Если бы только в Linux, я бы использовал bzip2, для немного лучших коэффициентов сжатия.
источник
xz сжимает намного лучше, чем bz2, но занимает больше времени. Итак, если ваша цель - максимальное сжатие, а пространство на вашем жестком диске выше (это мой случай с одним заполненным диском на 98% - в то время как я реорганизую свои файловые системы), и вы можете запустить сценарий, чтобы выполнить работу - сделать перерыв и вернуться через 5 минут.
В моем опыте unxz очень быстро распаковывается, и это хорошо для меня каждый день.
bz2 быстрее сжимается, чем xz, но, похоже, не достигает результатов сжатия xz.
Единственный способ сделать эти оценки - запустить тесты для набора общих файлов, которые вы обычно сжимаете / распаковываете, и варьировать параметры, чтобы увидеть, что выходит впереди.
источник