Lossy ASCII художественное сжатие

21

Задний план

PICASCII - это аккуратный инструмент, который преобразует изображения в ASCII- .

Он достигает различной степени яркости, используя следующие десять символов ASCII:

@#+';:,.` 

Мы скажем, что эти charxels (элементы символов) имеют яркость от 1 (знак-знак) до 10 (пробел).

Ниже вы можете увидеть результаты преобразования небольшого кода, уэльского флага, загнутого фрактала, большой форели и небольшого гольфа, отображаемых с правильным шрифтом:

ASCII искусство

Вы можете увидеть изображения в этой скрипке и загрузить их с Google Drive .

задача

В то время как конечные результаты PICASCII визуально приятны, все пять комбинированных изображений весят 153 559 байт. Насколько эти изображения могут быть сжаты, если мы готовы пожертвовать частью их качества?

Ваша задача - написать программу, которая принимает художественное изображение ASCII, такое как приведенные выше, и минимальное качество в качестве входных данных и печатает сжатие изображения с потерями - в виде полной программы или функции, возвращающей одну строку - которая удовлетворяет требование к качеству.

Это означает, что вы не можете написать отдельный декомпрессор; он должен быть встроен в каждое сжатое изображение.

Исходное изображение будет состоять из charxels с яркостью от 1 до 10, разделенных переводом строки на строки одинаковой длины. Сжатое изображение должно иметь одинаковые размеры и использовать одинаковый набор символов.

Для несжатого изображения, состоящего из n символов, качество сжатой версии изображения определяется как

формула качества

где c i - яркость i- го charxel вывода сжатого изображения, а u i - яркость i- го charxel несжатого изображения.

счет

Ваш код будет работать с пятью изображениями сверху в качестве входных данных и минимальными настройками качества 0,50, 0,60, 0,70, 0,80 и 0,90 для каждого из изображений.

Ваша оценка - это среднее геометрическое размеров всех сжатых изображений, т. Е. Двадцать пятый корень из произведения длин всех двадцати пяти сжатых изображений.

Самый низкий балл побеждает!

Дополнительные правила

  • Ваш код должен работать с произвольными изображениями, а не только с теми, которые используются для оценки.

    Ожидается, что вы оптимизируете свой код для тестовых случаев, но программа, которая даже не пытается сжать произвольные изображения, не получит от меня одобрения.

  • Ваш компрессор может использовать встроенные компрессоры потока байтов (например, gzip), но вы должны сами реализовать их для сжатых изображений.

    Допускаются встроенные функции, обычно используемые в декомпрессорах потока байтов (например, базовое преобразование, декодирование по длине прогона).

  • Компрессор и сжатые изображения не обязательно должны быть на одном языке.

    Однако вы должны выбрать один язык для всех сжатых изображений.

  • Для каждого сжатого изображения применяются стандартные правила игры в гольф.

верификация

Я создал сценарий CJam, чтобы легко проверить все требования к качеству и рассчитать оценку для представления.

Вы можете скачать интерпретатор Java здесь или здесь .

e# URLs of the uncompressed images.
e# "%s" will get replaced by 1, 2, 3, 4, 5.

"file:///home/dennis/codegolf/53199/original/image%s.txt"

e# URLs of the compressed images (source code).
e# "%s-%s" will get replaced by "1-50", "1-60", ... "5-90".

"file:///home/dennis/codegolf/53199/code/image%s-%s.php"

e# URLs of the compressed images (output).

"file:///home/dennis/codegolf/53199/output/image%s-%s.txt"

e# Code

:O;:C;:U;5,:)
{
    5,5f+Af*
    {
        C[IQ]e%g,X*:X;
        ISQS
        [U[I]e%O[IQ]e%]
        {g_W=N&{W<}&}%
        _Nf/::,:=
        {
            {N-"@#+';:,.` "f#}%z
            _::m2f#:+\,81d*/mq1m8#
            _"%04.4f"e%S
            @100*iQ<"(too low)"*
        }{
            ;"Dimension mismatch."
        }?
        N]o
    }fQ
}fI
N"SCORE: %04.4f"X1d25/#e%N

пример

Bash → PHP, оценка 30344,0474

cat

Достигает 100% качества для всех входов.

$ java -jar cjam-0.6.5.jar vrfy.cjam
1 50 1.0000 
1 60 1.0000 
1 70 1.0000 
1 80 1.0000 
1 90 1.0000 
2 50 1.0000 
2 60 1.0000 
2 70 1.0000 
2 80 1.0000 
2 90 1.0000 
3 50 1.0000 
3 60 1.0000 
3 70 1.0000 
3 80 1.0000 
3 90 1.0000 
4 50 1.0000 
4 60 1.0000 
4 70 1.0000 
4 80 1.0000 
4 90 1.0000 
5 50 1.0000 
5 60 1.0000 
5 70 1.0000 
5 80 1.0000 
5 90 1.0000 

SCORE: 30344.0474
Деннис
источник
У меня возникли некоторые проблемы с пониманием этой части: если кто-то выбирает q = 0,5, то каждый символ во входном файле должен быть заменен символом с половиной яркости на выходе, верно? Очевидно, исключая пробелы, так как это испортит все изображение.
Николас Сиплис
1
Это слишком запутанно и лазейка. Как остановить запись mattmahoney.net/dc/barf.html ? Может ли декомпрессор читать любой файл, кроме сжатого изображения? Можете ли вы предоставить скрипт на Python или что-то, что на самом деле проверяет качество изображения и вычисляет баллы, чтобы на этом фронте тоже не было никаких споров? И т.д.
Уилл
1
@ Будешь сбивать с толку? Может быть. Но я не думаю, что это лазейка. Каждое сжатое изображение должно быть программой или функцией, поэтому несмешные шутки, такие как BARF, автоматически исключаются. Я не знаю Python, но я подумаю о чем-то простом для проверки.
Деннис
8
«Я создал скрипт CJam, чтобы легко проверить все требования к качеству и рассчитать оценку». Люди действительно используют эту вещь, чтобы делать нормальные сценарии? Дорогой господин ...
Роковой

Ответы:

4

Java → CJam, оценка ≈4417,89

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.Reader;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

import net.aditsu.cjam.CJam;

public class Compress {
    protected static final char[] DIGITS = "0123456789ABCDEFGHIJK".toCharArray();
    protected static final String CHARS = "@#+';:,.` ";
    protected static final char[] CHR = CHARS.toCharArray();

    private static class Img {
        public final int rows;
        public final int cols;
        public final int[][] a;

        public Img(final int rows, final int cols) {
            this.rows = rows;
            this.cols = cols;
            a = new int[rows][cols];
        }

        public Img(final List<String> l) {
            rows = l.size();
            cols = l.get(0).length();
            a = new int[rows][cols];
            for (int i = 0; i < rows; ++i) {
                for (int j = 0; j < cols; ++j) {
                    a[i][j] = CHARS.indexOf(l.get(i).charAt(j));
                }
            }
        }

        public static Img read(final Reader r) {
            try {
                final BufferedReader br = new BufferedReader(r);
                final List<String> l = new ArrayList<>();
                while (true) {
                    final String s = br.readLine();
                    if (s == null || s.isEmpty()) {
                        break;
                    }
                    l.add(s);
                }
                br.close();
                return new Img(l);
            }
            catch (IOException e) {
                throw new RuntimeException(e);
            }
        }

        public static Img read(final File f) {
            try {
                return read(new FileReader(f));
            }
            catch (IOException e) {
                throw new RuntimeException(e);
            }
        }

        public Img scaleDown(final int fr, final int fc) {
            final int r1 = (rows + fr - 1) / fr;
            final int c1 = (cols + fc - 1) / fc;
            final Img x = new Img(r1, c1);
            final int[][] q = new int[r1][c1];
            for (int i = 0; i < rows; ++i) {
                for (int j = 0; j < cols; ++j) {
                    x.a[i / fr][j / fc] += a[i][j];
                    q[i / fr][j / fc]++;
                }
            }
            for (int i = 0; i < r1; ++i) {
                for (int j = 0; j < c1; ++j) {
                    x.a[i][j] /= q[i][j];
                }
            }
            return x;
        }

        public Img scaleUp(final int fr, final int fc) {
            final int r1 = rows * fr;
            final int c1 = cols * fc;
            final Img x = new Img(r1, c1);
            for (int i = 0; i < r1; ++i) {
                for (int j = 0; j < c1; ++j) {
                    x.a[i][j] = a[i / fr][j / fc];
                }
            }
            return x;
        }

        public Img crop(final int r, final int c) {
            if (r == rows && c == cols) {
                return this;
            }
            final Img x = new Img(r, c);
            for (int i = 0; i < r; ++i) {
                for (int j = 0; j < c; ++j) {
                    x.a[i][j] = a[i][j];
                }
            }
            return x;
        }

        public Img rescale(final int fr, final int fc) {
            return scaleDown(fr, fc).scaleUp(fr, fc).crop(rows, cols);
        }

        public double quality(final Img x) {
            if (x.rows != rows || x.cols != cols) {
                throw new IllegalArgumentException();
            }
            double t = 0;
            for (int i = 0; i < rows; ++i) {
                for (int j = 0; j < cols; ++j) {
                    final int y = a[i][j] - x.a[i][j];
                    t += y * y;
                }
            }
            t /= 81 * rows * cols;
            t = 1 - Math.sqrt(t);
            return Math.pow(t, 8);
        }

        @Override
        public String toString() {
            final StringBuilder sb = new StringBuilder();
            for (int i = 0; i < rows; ++i) {
                for (int j = 0; j < cols; ++j) {
                    sb.append(CHR[a[i][j]]);
                }
                sb.append('\n');
            }
            return sb.toString();
        }

        public Array toArray() {
            final Array x = new Array(rows * cols);
            int k = 0;
            for (int i = 0; i < rows; ++i) {
                for (int j = 0; j < cols; ++j) {
                    x.a[k++] = a[i][j];
                }
            }
            return x;
        }

        public String compress(final double quality) {
            int bi = 1;
            int bj = 1;
            int bs = rows * cols;
            Img bx = this;

            for (int i = 1; i < 3; ++i) {
                for (int j = 1; j < 3; ++j) {
                    Img x = rescale(i, j);
                    if (quality(x) >= quality) {
                        x = scaleDown(i, j);
                        if (x.rows * x.cols < bs) {
                            bi = i;
                            bj = j;
                            bs = x.rows * x.cols;
                            bx = x;
                        }
                    }
                }
            }

            Array a = bx.toArray();
            int bf = 0;
            for (int i = 1; i <= 20; ++i) {
                final int t = a.rle11(i).n;
                if (t < bs) {
                    bs = t;
                    bf = i;
                }
            }

            int b = 10;
            if (bf > 0) {
                b = 11;
                a = a.rle11(bf);
            }

            String s = null;
            for (int i = 92; i < 97; ++i) {
                for (char c = ' '; c < '$'; ++c) {
                    final String t = a.cjamBase(b, i, c);
                    boolean ok = true;
                    for (int j = 0; j < t.length(); ++j) {
                        if (t.charAt(j) > '~') {
                            ok = false;
                            break;
                        }
                    }
                    if (!ok) {
                        continue;
                    }
                    if (s == null || t.length() < s.length()) {
                        s = t;
                    }
                }
            }

            if (bf > 0) {
                s += "{(_A={;()";
                if (bf > 1) {
                    s += DIGITS[bf] + "*";
                }
                s += "\\(a@*}&\\}h]e_";
            }
            if (bi * bj == 1) {
                return s + '"' + CHARS + "\"f=" + cols + "/N*";
            }
            s += bx.cols + "/";
            if (bi > 1) {
                s += bi + "e*";
                if (rows % 2 == 1) {
                    s += "W<";
                }
            }
            if (bj > 1) {
                s += bj + "fe*";
                if (cols % 2 == 1) {
                    s += "Wf<";
                }
            }
            return s + '"' + CHARS + "\"ff=N*";
        }

        public void verify(final String s, final double quality) {
            final String t = CJam.run(s, "");
            final Img x = read(new StringReader(t));
            final double q = quality(x);
            if (q < quality) {
                throw new RuntimeException(q + " < " + quality);
            }
//          System.out.println(q + " >= " + quality);
        }
    }

    private static class Array {
        public final int[] a;
        public final int n;

        public Array(final int n) {
            this.n = n;
            a = new int[n];
        }

        public Array(final int[] a) {
            this.a = a;
            n = a.length;
        }

        public String join() {
            final StringBuilder sb = new StringBuilder();
            for (int x : a) {
                sb.append(x).append(' ');
            }
            sb.setLength(sb.length() - 1);
            return sb.toString();
        }

//      public String cjamStr() {
//          final StringBuilder sb = new StringBuilder("\"");
//          for (int x : a) {
//              sb.append(DIGITS[x]);
//          }
//          sb.append("\":~");
//          return sb.toString();
//      }

        public String cjamBase(final int m, final int b, final char c) {
            final boolean zero = a[0] == 0;
            String s = join();
            if (zero) {
                s = "1 " + s;
            }
            s = CJam.run("q~]" + m + "b" + b + "b'" + c + "f+`", s);
            s += "'" + c + "fm" + b + "b" + DIGITS[m] + "b";
            if (zero) {
                s += "1>";
            }
            return s;
        }

        public Array rle11(final int f) {
            final int[] b = new int[n];
            int m = 0;
            int x = -1;
            int k = 0;
            for (int i = 0; i <= n; ++i) {
                final int t = i == n ? -2 : a[i];
                if (t == x && m < 11 * f) {
                    m++;
                }
                else {
                    if (m >= f && m > 3) {
                        b[k++] = 10;
                        b[k++] = m / f - 1;
                        b[k++] = x;
                        for (int j = 0; j < m % f; ++j) {
                            b[k++] = x;
                        }
                    }
                    else {
                        for (int j = 0; j < m; ++j) {
                            b[k++] = x;
                        }
                    }
                    m = 1;
                    x = t;
                }
            }
            return new Array(Arrays.copyOf(b, k));
        }
    }

    private static void score() {
        double p = 1;
        for (int i = 1; i < 6; ++i) {
            final File f = new File("image" + i + ".txt");
            final Img img = Img.read(f);
            final int n = (int) f.length();
            for (int j = 5; j < 10; ++j) {
                final double q = j / 10.0;
                final String s = img.compress(q);
                System.out.println(f.getName() + ", " + q + ": " + n + " -> " + s.length());
                img.verify(s, q);
                p *= s.length();
            }
        }
        System.out.println(Math.pow(p, 1 / 25.0));
    }

    public static void main(final String... args) {
        if (args.length != 2) {
            score();
            return;
        }
        final String fname = args[0];
        final double quality = Double.parseDouble(args[1]);
        try {
            final Img img = Img.read(new File(fname));
            final String s = img.compress(quality);
            img.verify(s, quality);
            final FileWriter fw = new FileWriter(fname + ".cjam");
            fw.write(s);
            fw.close();
        }
        catch (IOException e) {
            throw new RuntimeException();
        }
    }
}

Требуется банка CJam в пути к классам. Если вы дадите ему 2 аргумента командной строки (имя файла и качество), он добавляет «.cjam» к имени файла и записывает сжатое изображение туда. В противном случае он рассчитывает свою оценку по 5 тестовым изображениям, которые предположительно находятся в текущем каталоге. Программа также проверяет каждое сжатое изображение автоматически. Возможно, вы захотите еще раз проверить расчет баллов в случае каких-либо расхождений.

Используемые методы (пока что): масштабирование вдвое (по горизонтали, вертикали или обоим), если это не слишком сильно снижает качество, пользовательское кодирование RLE и базовое преобразование для упаковки большего количества данных в каждый символ, оставаясь в диапазон печати ASCII.

aditsu
источник
Не могли бы вы дать мне краткий обзор о том, как запустить это? Я скомпилировал (думаю, успешно) с javac -cp cjam-0.6.5.jar Compress.java, но java -cp cjam-0.6.5.jar Compressговорит Error: Could not find or load main class Compressи java Compressне находит класс CJam.
Деннис
@Dennis Вам нужно добавить каталог, содержащий Compress.class, в classpath (-cp). Если это в текущем каталоге, используйте -cp .:cjam-0.6.5.jar(в windoze я думаю, что вам нужно точка с запятой вместо двоеточия)
aditsu
Это сработало, спасибо.
Деннис
2

Python 3.5 (основной и выходной) (в настоящее время неконкурентный)

С днем ​​рождения, вызов! Вот ваш подарок: ответ!

РЕДАКТИРОВАТЬ: преобразованный вывод в код Python, улучшенная степень сжатия (немного) EDIT2: сделал его печатать сырой, когда size равен 1. Улучшенный счет, но счет должен быть рассчитан снова. EDIT3: @Dennis указал, что у меня все еще есть ошибки, чтобы исправить, поэтому я отметил ответ как неконкурентный

Код:

import sys
LIST = [' ','`','.',',',':',';',"'",'+','#','@']

def charxel_to_brightness(charxel):
    return LIST.index(charxel)

def brightness_to_charxel(bright):
    return LIST[bright]

def image_to_brightness(imagetext):
    return [list(map(charxel_to_brightness,line)) for line in imagetext.split("\n")]

def brightness_to_image(brightarray):
    return '\n'.join([''.join(map(brightness_to_charxel,line)) for line in brightarray])

def split_into_parts(lst,size):
    return [lst[x:x+size] for x in range(0, len(lst), size)]

def gen_updown(startxel,endxel,size):
    return [[int((size-r)*(endxel-startxel)/size+startxel) for c in range(size)] for r in range(size)]

def gen_leftright(startxel,endxel,size):
    return [[int((size-c)*(endxel-startxel)/size+startxel) for c in range(size)] for r in range(size)]

def gen_tlbr(startxel,endxel,size):
    return [[int((2*size-r-c)/2*(endxel-startxel)/size+startxel) for c in range(size)] for r in range(size)]

def gen_bltr(startxel,endxel,size):
    return [[int((size-r+c)/2*(endxel-startxel)/size+startxel) for c in range(size)] for r in range(size)]

def gen_block(code,startxel,endxel,size):
    if code==0:return gen_updown(startxel,endxel,size)
    if code==1:return gen_leftright(startxel,endxel,size)
    if code==2:return gen_bltr(startxel,endxel,size)
    if code==3:return gen_tlbr(startxel,endxel,size)

def vars_to_data(code,startxel,endxel):
    acc=endxel
    acc+=startxel<<4
    acc+=code<<8
    return acc

def data_to_vars(data):
    code=data>>8
    startxel=(data>>4)&15
    endxel=data&15
    return code,startxel,endxel

def split_into_squares(imgarray,size):
    rows = split_into_parts(imgarray,size)
    allsquares = []
    for rowblock in rows:
        splitrows = []
        for row in rowblock:
            row = split_into_parts(row,size)
            splitrows.append(row)
        rowdict = []
        for row in splitrows:
            for x in range(len(row)):
                if len(rowdict)<=x:
                    rowdict.append([])
                rowdict[x].append(row[x])
        allsquares.append(rowdict)
    return allsquares

def calc_quality(imgarray,comparray):
    acc=0
    for row in range(len(imgarray)):
        for col in range(len(imgarray[row])):
            acc+=pow(imgarray[row][col]-comparray[row][col],2)
    return (1-(acc/81.0/sum([len(row) for row in imgarray]))**.5)**8

def fuse_squares(squarray):
    output=[]
    counter=0
    scounter=0
    sqrow=0
    while sqrow<len(squarray):
        if scounter<len(squarray[sqrow][0]):
            output.append([])
            for square in squarray[sqrow]:
                output[counter].extend(square[scounter])
            scounter+=1
            counter+=1
        else:
            scounter=0
            sqrow+=1
    return output

def main_calc(imgarray,threshold):
    imgarray = image_to_brightness(imgarray)
    size = 9
    quality = 0
    compimg=[]
    datarray=[]
    testdata = [vars_to_data(c,s,e) for c in range(4) for s in range(10) for e in range(10)]
    while quality<threshold:
        squares = split_into_squares(imgarray,size)
        compimg = []
        datarray = []
        testblock = [gen_block(c,s,e,size) for c in range(4) for s in range(10) for e in range(10)]
        for row in squares:
            comprow = []
            datrow=[]
            for square in row:
                quality_values = [calc_quality(square,block) for block in testblock]
                best_quality = quality_values.index(max(quality_values))
                comprow.append(testblock[best_quality])
                datrow.append(testdata[best_quality])
            compimg.append(comprow)
            datarray.append(datrow)
        compimg = fuse_squares(compimg)
        quality = calc_quality(imgarray,compimg)
        print("Size:{} Quality:{}".format(size,quality))
        size-=1
    return brightness_to_image(compimg),datarray,size+1

template = '''def s(d,s,e,z):
 x=range(z)
 return d<1 and[[int((z-r)*(e-s)/z+s)for c in x]for r in x]or d==1 and[[int((z-c)*(e-s)/z+s)for c in x]for r in x]or d==2 and[[int((2*z-r-c)/2*(e-s)/z+s)for c in x]for r in x]or d>2 and[[int((z-r+c)/2*(e-s)/z+s)for c in x] for r in x]
i=lambda a:'\\n'.join([''.join(map(lambda r:" `.,:;'+#@"[r],l))for l in a])
def f(a):
 o=[];c=0;s=0;r=0
 while r<len(a):
  if s<len(a[r][0]):
   o.append([])
   for q in a[r]:
    o[c].extend(q[s])
   s+=1;c+=1
  else:
   s=0;r+=1
 return o
t={};z={}
print(i(f([[s(D>>8,(D>>4)&15,D&15,z)for D in R]for R in t])))'''

template_size_1 = '''print("""{}""")'''   

def main(filename,threshold):
    print(filename+" "+str(threshold))
    file = open(filename,'r')
    compimg,datarray,size = main_calc(file.read(),threshold)
    file.close()
    textoutput = open(filename.split(".")[0]+"-"+str(threshold*100)+".txt",'w')
    textoutput.write(compimg)
    textoutput.close()
    compoutput = open(filename.split(".")[0]+"-"+str(threshold*100)+".py",'w')
    datarray = str(datarray).replace(" ","")
    code = ""
    if size==1:
        code = template_size_1.format(compimg)
    else:
        code= template.format(datarray,str(size))
    compoutput.write(code)
    compoutput.close()
    print("done")

if __name__ == "__main__":
    main(sys.argv[1],float(sys.argv[2]))

Этот ответ может использовать много улучшений, поэтому я, вероятно, над этим поработаю больше на выходных.

Как это работает:

  • Разделите изображение на блоки размера size .
  • Найти лучший соответствующий блок
    • Блоки могут иметь градиент сейчас!
  • Рассчитать качество (по формуле) для всего изображения.
  • Если правильно, запишите сжатое изображение в файл.
  • В противном случае уменьшите значение sizeи попробуйте снова.

Этот алгоритм хорошо работает для низкого качества (0,5, 0,6), но не слишком хорошо работает для изображений более высокого качества (фактически раздувает). Это также очень медленно.

Здесь у меня есть все сгенерированные файлы, поэтому вам не придется заново их генерировать.

синий
источник
Наконец-то ответ! Это технически неконкурентоспособно, хотя, так как я создал Bubblegum после публикации этого задания ... Я позже запустите скрипт скоринга и, возможно, перенесу его на менее эзотерический язык.
Деннис
@ Денис А, ну, не должно быть слишком сложно портировать вывод на скрипт на python. Спасибо за хедз-ап
Blue
Я просто перечитал свою задачу (через год я немного запутался в деталях), и там говорится, что ваш компрессор может использовать встроенные компрессоры потока байтов (например, gzip), но вы должны реализовать их самостоятельно для сжатые изображения. Это означает, что Bubblegum все равно отсутствует.
Деннис
Я наконец вспомнил, что обещал забить это; Извините за задержку. В вашем коде, похоже, есть опечатка ( compingдолжна быть compimg), которую я исправил для запуска программы. Если я не допустил ошибку при запуске вашего кода, размеры некоторых из сгенерированных изображений являются неправильными (например, image2.txtимеет 33 164 байта, но image2-50.0.txtимеет 33 329), а другие не генерируют тот же файл при запуске сгенерированных программ ( image3-50.0.txtимеет качество 0,5110 , но запуск сгенерированной программы приводит к качеству 0,4508 ).
Деннис
Приложение: я скачал image3-50.0.pyс вашего Dropbox, и он совпадает с файлом, который я сгенерировал.
Деннис