Распределение по отсортированным спискам

10

Скажем, у нас есть упорядоченный список товаров

[a, b, c, ... x, y, z, ...]

Я ищу семейство дистрибутивов с поддержкой в ​​списке выше, управляемых некоторым параметром альфа, чтобы:

  • При альфа = 0 он присваивает вероятность 1 первому элементу, a выше, а 0 остальным. То есть, если мы сделаем выборку из этого списка, с заменой мы всегда получим a.
  • Поскольку альфа увеличивается, мы назначаем все более и более высокие вероятности остальной части списка, соблюдая порядок списка после экспоненциального затухания.
  • Когда альфа = 1, мы назначаем равную вероятность для всех элементов в списке, поэтому выборка из списка сродни игнорированию его порядка.

Это очень похоже на геометрическое распределение, но есть некоторые заметные различия:

  • Распределение геометрического распределения определяется по всем натуральным числам. В моем случае выше, список имеет фиксированный размер.
  • Геометрическое распределение не определено для альфа = 0.
Амелио Васкес-Рейна
источник
1
Похоже, вы описываете семейство усеченных геометрических распределений. Однако существует бесконечно много семей, которые качественно ведут себя так, как вы описали. Более того, можно объяснить, для чего вы хотели бы использовать такую ​​семью.
whuber
Спасибо @whuber Да, я понимаю, что существует бесконечно много дистрибутивов, которые соответствуют этому описанию. Какие-нибудь конкретные, которые приходят на ум? У меня есть система, которая в настоящее время выбирает первый элемент этого списка (представляет баллы), но я хочу рандомизировать этот выбор (и параметризовать эту рандомизацию). Я не ищу определенный тип "распада" на основе альфа. Пока альфа = 0 не представляет никакой рандомизации, то есть выбрать первый элемент, 1 представляет «выбрать любой элемент», а альфа между 0 и 1 представляют «что-то среднее» между этими двумя альфами, это было бы достаточно хорошо.
Амелио Васкес-Рейна

Ответы:

11

Предположим, что , ранг элемента списка i , имеет значение в { 0 , 1 , , n - 1 } для списка из n элементов (связи могут быть разорваны случайным образом). Тогда мы могли бы определить вероятность выбора i :ряя{0,1,...,N-1}Nя

пязнак равноαряΣКзнак равно1NαрК

Это в основном только надлежащим образом нормализована усечен геометрическое распределение, и это также относится к в функции SoftMax . В частном случае используйте соглашение 0 0 = 1 . Обратите внимание, что знаменатель всегда можно записать в простом выражении в замкнутой форме. Для α < 1 он принимает значение 1 - α nαзнак равно000знак равно1α<1 , а дляα=1принимает значениеn.1-αN1-ααзнак равно1N

С ясно, что это просто назначает равную вероятность каждому элементу. При α 0 это приближается, давая всю массу вероятности первому элементу.αзнак равно1α0

В списке из 10 элементов запрошенное примерно экспоненциальное уменьшение очевидно при :αзнак равно0,5

п00,5005п10,2502п20,1251п30,0626п40,0313п50,0156п60,0078п70,0039п80,0020п90,0010

На следующем графике показано, как изменяется вероятность выбора первого элемента на основе с использованием списка длиной 10.α

введите описание изображения здесь

josliber
источник
Ницца. Это намного умнее, чем я когда-либо мог надеяться.
Мэтью Друри
@Matthew Это усеченные геометрические распределения, на которые я ссылался ранее.
whuber
4

Я постараюсь построить пример из первых принципов.

Давайте возьмем три распределения в качестве наших строительных блоков:

  • P - это распределение, присваивающее вероятность один первому элементу списка, ноль всем остальным.
  • 12141
  • U - равномерное распределение по списку.

Теперь мы хотим взять однопараметрическое семейство положительных выпуклых комбинаций этих распределений.

α(T)п+β(T)Е+γ(T)U

α(T)+β(T)+γ(T)знак равно1T[0,1]α(0)знак равно1γ(1)знак равно1

(α(T),β(T),γ(T))(1,0,0),(0,1,0),(0,0,1)T(0,1)

Вот вариант для кривой:

(1-T(1-T))(1-T,0,T)+T(1-T)(13,13,13)

(1-T,0,T)(13,13,13)T(0,1)

Мэтью Друри
источник