Вопросы с тегом «data-compression»

38
Можно ли использовать PRNG для магического сжатия материала?

Эта идея пришла мне в голову, когда я учился программировать и впервые столкнулся с PRNG. Я до сих пор не знаю, насколько это реалистично, но сейчас происходит обмен стека. Вот схема 14-летнего ребенка для удивительного алгоритма сжатия: Возьмите PRNG и начните его с seed, sчтобы получить длинную...

38
Существует ли известный максимум того, сколько строк 0 и 1 могут быть сжаты?

Давным-давно я читал газетную статью, в которой какой-то профессор сказал, что в будущем мы сможем сжать данные до двух бит (или что-то в этом роде). Это, конечно, не правильно (и, возможно, моя память о том, что он точно сказал, не верна). Понятно, что было бы нецелесообразно сжимать какую-либо...

35
Уменьшают ли алгоритмы сжатия без потерь энтропию?

Согласно Википедии : Энтропия Шеннона измеряет информацию, содержащуюся в сообщении, в отличие от той части сообщения, которая определена (или предсказуема). Примеры последних включают избыточность в структуре языка или статистических свойствах, связанных с частотой встречаемости пар букв или слов,...

30
Перечислите все неизоморфные графы определенного размера.

Я хотел бы перечислить все неориентированные графы размера , но мне нужен только один экземпляр каждого класса изоморфизма . Другими словами, я хочу перечислить все неизоморфные (неориентированные) графы по n вершинам. Как я могу это сделать?NnnNnn Точнее, я хочу алгоритм, который будет...

27
Эффективное сжатие простых двоичных данных

У меня есть файл, содержащий упорядоченные двоичные числа от до 2 n - 1 :0002n−12n−12^n - 1 0000000000 0000000001 0000000010 0000000011 0000000100 ... 1111111111 7z не сжимал этот файл очень эффективно (при n = 20 22 МБ были сжаты до 300 кБ). Существуют ли алгоритмы, которые могут распознать очень...

25
Разве случайность фон Неймана в кавычках больше не применима?

Какой-то парень сказал следующее: Любой, кто пытается генерировать случайные числа детерминистскими средствами, конечно же, живет в состоянии греха. Это всегда означает, что вы не можете генерировать истинные случайные числа только с помощью компьютера. И он сказал, что когда компьютеры были...

22
Аппроксимация колмогоровской сложности

Я изучил кое-что о сложности Колмогорова , прочитал некоторые статьи и книги Витани и Ли и использовал концепцию нормализованного расстояния сжатия для проверки стилометрии авторов (определите, как каждый автор пишет некоторые текстовые и групповые документы по их сходству). В этом случае...

22
Сжатие данных с использованием простых чисел

Недавно я наткнулся на следующую интересную статью, в которой утверждается, что эффективное сжатие случайных наборов данных всегда более чем на 50%, независимо от типа и формата данных. В основном он использует простые числа для уникального построения представления 4-байтовых блоков данных, которые...

21
Сжатие доменных имен

Мне любопытно, как можно очень компактно сжать домен произвольного имени хоста IDN (как определено в RFC5890 ), и подозреваю, что это может стать интересной задачей. Хост Unicode или доменное имя (U-метка) состоит из строки символов Unicode, обычно ограниченных одним языком в зависимости от домена...

21
Почему эти (без потерь) методы сжатия многих похожих изображений PNG неэффективны?

Я просто наткнулся на следующее: я положил несколько одинаковых копий png-изображения в папку, а затем попытался сжать эту папку следующими способами: tar czf folder.tar.gz folder/ tar cf folder.tar folder/ && xz --stdout folder.tar > folder.tar.xz (это хорошо работает для идентичных...

20
Сжатие двух целых чисел без учета порядка

Сравнивая упорядоченную пару (x, y) с неупорядоченной парой {x, y} (set), затем теоретически определяем, что разница составляет всего один бит, так как x идет первым или y требуется ровно один бит для представления. Итак, если нам дан набор {x, y}, где x, y - два разных 32-разрядных целых числа,...

17
Можно ли сжать данные до размера, который меньше предела сжатия данных Шеннона?

Я читал об алгоритмах сжатия данных и теоретическом пределе для сжатия данных. Недавно я столкнулся с методом сжатия под названием «Комбинаторное энтропийное кодирование», основная идея этого метода заключается в кодировании файла в виде символов, представленных в файле, их частоты и индекса...

11
Существуют ли алгоритмы сжатия на основе PI?

Что мы знаем, так это то, что π бесконечно и вполне вероятно, что оно содержит все возможные конечные цепочки цифр ( дизъюнктивная последовательность ). Недавно я видел некоторый прототип πfs, который предполагает, что каждый файл, который вы создали (или кто-либо еще) или вы создадите, он уже там,...

11
Существует ли обобщение кодирования Хаффмана на арифметическое кодирование?

Пытаясь понять взаимосвязи между кодированием Хаффмана, арифметическим кодированием и дистанционным кодированием, я начал думать о недостатках кодирования Хаффмана, связанных с проблемой дробной битовой упаковки . То есть, предположим, что у вас есть 240 возможных значений для символа, и вам...

9
Всегда ли оптимально кодирование Хаффмана?

Требование кодирования без префикса приводит к большим деревьям из-за того, что дерево должно быть завершено. Существует ли порог, в котором некодированное хранение данных фиксированной длины будет более эффективным, чем кодирование...