Напишите утилиту сжатия для файлов gzip

11

Задача этой задачи заключается в следующем:

Напишите программу, которая читает файл разумного размера (скажем, <16 МБ) из стандартного ввода или где-либо еще (как вам нравится, но не должен быть жестко задан) и помещает сжатый вывод в стандартный вывод. Вывод должен быть действительным сжатым файлом gzip, и если сжатый файл проходит через gunzip, он должен дать точно такой же файл, как и раньше.

правила

  • Используемый язык программирования должен быть известен до начала конкурса
  • Оценка вашей программы - это количество символов исходного кода или собранной программы (что короче)
  • Вам не разрешено использовать любые существующие библиотеки сжатия.
  • Повеселись!
FUZxxl
источник
2
Разрешено ли использование встроенных библиотек?
hallvabo
@hallvabo: Нет. Забыли это. Thx
FUZxxl
2
Вероятно, лучший способ сделать это - просто заполнить ввод маркерами «следующий блок несжатый» в начале каждого блока.
Анон.
GZIP это язык программирования. Не полный по Тьюрингу.
Александру
1
Это в значительной степени идентично проблеме оружия и молний . Почему кто-то будет публиковать свои ответы здесь, а не на codegolf.com, мне не понятно, если только они не хотят решать его на языке, не поддерживаемом codegolf.com (например, GolfScript).
Крис Шут-Янг

Ответы:

10

C # (534 символа)

using System.IO;using B=System.Byte;class X{static void Main(string[]a){var f=File.ReadAllBytes(a[0]);int l=f.Length,i=0,j;var p=new uint[256];for(uint k=0,r=0;k<256;r=++k){for(j=0;j<8;j++)r=r>>1^(r&1)*0xedb88320;p[k]=r;}uint c=~(uint)0,n=c;using(var o=File.Open(a[0]+".gz",FileMode.Create)){o.Write(new B[]{31,139,8,0,0,0,0,0,4,11},0,10);for(;i<l;i++){o.Write(new B[]{(B)(i<l-1?0:1),1,0,254,255,f[i]},0,6);c=p[(c^f[i])&0xFF]^c>>8;}c^=n;o.Write(new[]{(B)c,(B)(c>>8),(B)(c>>16),(B)(c>>24),(B)l,(B)(l>>8),(B)(l>>16),(B)(l>>24)},0,8);}}}

Гораздо более читабельно:

using System.IO;
using B = System.Byte;
class X
{
    static void Main(string[] a)
    {
        // Read file contents
        var f = File.ReadAllBytes(a[0]);
        int l = f.Length, i = 0, j;

        // Initialise table for CRC hashsum
        var p = new uint[256];
        for (uint k = 0, r = 0; k < 256; r = ++k)
        {
            for (j = 0; j < 8; j++)
                r = r >> 1 ^ (r & 1) * 0xedb88320;
            p[k] = r;
        }

        uint c = ~(uint) 0, n = c;

        // Write the output file
        using (var o = File.Open(a[0] + ".gz", FileMode.Create))
        {
            // gzip header
            o.Write(new B[] { 31, 139, 8, 0, 0, 0, 0, 0, 4, 11 }, 0, 10);
            for (; i < l; i++)
            {
                // deflate block header plus one byte of payload
                o.Write(new B[] { (B) (i < l - 1 ? 0 : 1), 1, 0, 254, 255, f[i] }, 0, 6);
                // Compute CRC checksum
                c = p[(c ^ f[i]) & 0xFF] ^ c >> 8;
            }
            c ^= n;
            o.Write(new[] {
                // CRC checksum
                (B) c, (B) (c >> 8), (B) (c >> 16), (B) (c >> 24),
                // original file size
                (B) l, (B) (l >> 8), (B) (l >> 16), (B) (l >> 24)
            }, 0, 8);
        }
    }
}

Комментарии:

  • Ожидается путь к файлу в качестве первого аргумента командной строки.

  • Выходной файл - это входной файл + .gz.

  • Я не использую библиотеки для gzip, deflate или CRC32. Это все там.

  • Этот «компрессор» увеличивает размер файла в 6 раз. Но он в правильном формате gzip!

  • Протестировано с использованием GNU gunzip и WinRAR.

Timwi
источник