Что делает хорошую таблицу перестановок?

8

Я реализую улучшенный шум Перлина . Его ключевой особенностью для рандомизации является жестко закодированная таблица перестановок, которая дает практически случайные, но воспроизводимые градиенты в ячейках сетки. Таблица перестановок - это просто перестановка целых чисел 0..255, и обычно это следующая таблица (скопированная прямо из первоначальной реализации Perlin):

{151, 160, 137, 91, 90, 15, 131, 13, 201, 95, 96, 53, 194, 233, 7,
225, 140, 36, 103, 30, 69, 142, 8, 99, 37, 240, 21, 10, 23, 190, 6, 148, 247,
120, 234, 75, 0, 26, 197, 62, 94, 252, 219, 203, 117, 35, 11, 32, 57, 177, 33,
88, 237, 149, 56, 87, 174, 20, 125, 136, 171, 168, 68, 175, 74, 165, 71, 134,
139, 48, 27, 166, 77, 146, 158, 231, 83, 111, 229, 122, 60, 211, 133, 230, 220,
105, 92, 41, 55, 46, 245, 40, 244, 102, 143, 54, 65, 25, 63, 161, 1, 216, 80,
73, 209, 76, 132, 187, 208, 89, 18, 169, 200, 196, 135, 130, 116, 188, 159, 86,
164, 100, 109, 198, 173, 186, 3, 64, 52, 217, 226, 250, 124, 123, 5, 202, 38,
147, 118, 126, 255, 82, 85, 212, 207, 206, 59, 227, 47, 16, 58, 17, 182, 189,
28, 42, 223, 183, 170, 213, 119, 248, 152, 2, 44, 154, 163, 70, 221, 153, 101,
155, 167, 43, 172, 9, 129, 22, 39, 253, 19, 98, 108, 110, 79, 113, 224, 232,
178, 185, 112, 104, 218, 246, 97, 228, 251, 34, 242, 193, 238, 210, 144, 12,
191, 179, 162, 241, 81, 51, 145, 235, 249, 14, 239, 107, 49, 192, 214, 31, 181,
199, 106, 157, 184, 84, 204, 176, 115, 121, 50, 45, 127, 4, 150, 254, 138, 236,
205, 93, 222, 114, 67, 29, 24, 72, 243, 141, 128, 195, 78, 66, 215, 61, 156, 180};

Для справки: небольшой патч, извлеченный из шума, генерируемого этой таблицей, выглядит следующим образом:

введите описание изображения здесь

Однако я хотел бы, чтобы код был немного более гибким и позволял перестановку этой таблицы, чтобы я мог создать совершенно новое поле шума (вместо того, чтобы просто сэмплировать его с другим смещением). Но не все перестановки одинаково хорошо перемешаны. В маловероятном случае, когда случайная перестановка представляет собой просто отсортированный массив из 0to 255, шум будет выглядеть следующим образом:

введите описание изображения здесь

Это довольно плохо. Конечно, на шанс вЭто не тот случай, о котором мне нужно беспокоиться. Но, конечно, это не единственная перестановка, которая дает очень заметные артефакты. Обратно отсортированные и почти отсортированные перестановки, вероятно, будут иметь те же проблемы. Так сколько других перестановок не подходит? Скажем, код будет использоваться в популярной игре для генерации случайного мира, но все равно будет раздражать, если бы каждый сотый тысячный мир выглядел бы дистанционно регулярным.1256!

Таким образом, вопрос в том, что именно делает хорошую (или плохую) таблицу перестановок, и как я могу программно оценить качество таблицы перестановок, чтобы я мог еще раз переставить таблицу в маловероятном случае, когда я выброшу «плохую» " Таблица?

Мартин Эндер
источник
Статистические тесты для генераторов случайных чисел должны быть полезны. Вычисление ожидаемого количества пар в порядке (обратном порядке) может быть хорошим началом для теста. В этом документе много ссылок: csrc.nist.gov/groups/ST/toolkit/rng/documents/nissc-paper.pdf .
Даниэль М Гессель

Ответы:

4

Прежде всего - число не должно встречаться дважды, это подразумевается, поскольку мы говорим о перестановках. Поэтому заполнение таблицы простой случайной (255) функцией не сработает.

Во-вторых , вам необходимо убедиться в отсутствии преждевременных повторений:

Рассмотрим значения 1,2,3,4 - таблица перестановок 4,3,2,1 не очень хорошая из-за ее коротких циклических свойств, то есть 1 -> 4, 4 -> 1. Аналогично с 4,2 3,1 или 1,2,3,4. Оптимальные столы проведут вас через все позиции: 3,1,4,2 или 2,4,1,3.

Это свойство становится все более важным по мере увеличения количества измерений и выполнения рекурсивных поисков.

Однако сам по себе этот подход может создать кластеры слишком похожих значений, которые могут быть или не быть желательными, что приводит меня к следующему пункту.

В-третьих , когда вы генерируете таблицу с нециклическими свойствами, вам нужно случайным образом просматривать оставшиеся неназначенные индексы. Когда это возможно, ограничьте случайное расстояние шага здесь определенным минимальным и максимальным диапазоном, например, 5..120, чтобы избежать кластерных групп схожих значений. С этими цифрами стоит поэкспериментировать.

mhbuur
источник
Добро пожаловать в компьютерную графику SE! Что касается вашего второго замечания, я посмотрел на циклическую декомпозицию таблицы перестановок, используемой Перлином. Он состоит из нескольких циклов длины {4, 121, 89, 12, 4, 15, 4, 6}, так что, видимо, этого достаточно? (Или, возможно, это не так, и другая таблица перестановок была бы даже «лучше»? Хотя я не уверен, что человек мог бы почувствовать разницу. Или на самом деле лучше иметь несколько циклов?) Я не следую вашему третьему пункту , Равномерное случайное распределение чего? И какое расстояние вы имеете в виду?
Мартин Эндер
Спасибо! Да, это было довольно загадочно, я думаю. Несколько лет назад я экспериментировал с этим, поэтому я не помню точную реализацию, но когда у вас есть реализация для генерации оптимального пути, должно стать очевидным, что вы выбираете случайные позиции того, что осталось от неиспользованных индексов - это та случайная длина шага, о которой я говорю. Я обновил ответ
mhbuur
1

Одной из возможностей может быть заимствование из криптографического сообщества и, в частности, подстановка 8–8 бит, используемая в шифре AES / Rijndael. Таблицу и код для ее генерации можно найти в википедии.

Я предполагаю, что для генерации до 256 дополнительных таблиц, вы можете просто сделать что-то вроде:

Func(U8 input, U8 TableNum) = SBox( (TableNum + Sbox(input)) Mod256 )

(поскольку функция SBox совершенно нелинейна)

Сказав это, (и, пожалуйста, прости меня, если я неправильно понял некоторые детали) в прошлой жизни я реализовал шум Перлина, используя относительно простую функцию RNG / Hash, но нашел корреляцию в X / Y / Z из-за моего простого отображение 2 или 3 измерений на скалярное значение было проблематичным. Я обнаружил, что очень простым решением было просто использовать CRC, например. что-то вроде

InputToRNGHash = CRC(Z xor CRC( Y xor CRC(X))). 

Учитывая то, что встроенные функции CRC могут быть встроены в процессор HW, это может быть быстрым подходом.

Саймон Ф
источник