Можно ли охарактеризовать многочлен (1 / n,…, 1 / n) как дискретный Дирихле (1, .., 1)?

24

Так что этот вопрос немного запутанный, но я добавлю красочные графики, чтобы восполнить это! Сначала предыстория, затем вопрос (ы).

Задний план

Скажем, у вас есть мерное полиномиальное распределение с равными вероятностями по категориям. Пусть - нормализованные значения ( ) из этого распределения, то есть:nnπ=(π1,,πn)c

(c1,,cn)Multinomial(1/n,,1/n)πi=cin

Теперь распределение по имеет поддержку по симплексу, но с дискретными шагами. Например, при этот дистрибутив имеет следующую поддержку (красные точки):πnn=3

введите описание изображения здесь

Другим распределением с аналогичной поддержкой является мерное распределение , то есть равномерное распределение по единичному симплексу. Например, вот случайные ничьи из 3-мерного :Дирихле ( 1 , , 1 ) Дирихле ( 1 , 1 , 1 )nDirichlet(1,,1)Dirichlet(1,1,1)

введите описание изображения здесь

Теперь у меня появилась идея, что распределение из распределения можно охарактеризовать как отрисовки из , которые дискретизируются до дискретной поддержки . Дискретизация, которую я имел в виду (и которая, кажется, работает хорошо), состоит в том, чтобы взять каждую точку симплекса и «округлить ее» до ближайшей точки, которая находится в поддержке . Для трехмерного симплекса вы получите следующий раздел, где точки в каждой цветной области должны «округляться» до ближайшей красной точки:Многочлен ( 1 / n , , 1 / n ) Дирихле ( 1 , , 1 ) π ππMultinomial(1/n,,1/n)Dirichlet(1,,1)ππ

введите описание изображения здесь

Поскольку распределение Дирихле является равномерным, результирующая плотность / вероятность для каждой из точек пропорциональна площади / объему, который «округляется» до каждой точки. Для двумерного и трехмерного случаев эти вероятности:

введите описание изображения здесь ( эти вероятности взяты из моделирования Монте-Карло )

Таким образом, кажется, что, по крайней мере для 2 и 3 измерений, полученное распределение вероятностей от дискретизации таким конкретным способом совпадает с распределением вероятности для . Это нормализованный результат распределения . Я также пробовал с 4-мя измерениями, и, похоже, там работает.π Многочлен ( 1 / n , , 1 / n )Dirichlet(1,,1)πMultinomial(1/n,,1/n)

Вопросов)

Итак, мой главный вопрос:

Дискретизируя однородный Дирихле таким конкретным способом, имеет ли отношение отношение для дальнейших измерений? Отношение имеет место вообще? (Я пробовал это только с помощью симуляции Монте-Карло ...)Multinomial(1/n,,1/n)

Дальше мне интересно:

  • Если это соотношение верно, это известный результат? И есть ли какой-нибудь источник, который я могу процитировать для этого?
  • Если эта дискретизация равномерного Дирихле не имеет этого отношения с Мультивиномом. Есть ли подобная конструкция, которая имеет?

Некоторый контекст

Моя причина для того, чтобы задать этот вопрос, заключается в том, что я смотрю на сходство непараметрического Bootstrap и байесовского Bootstrap, и затем это выяснилось. Я также заметил, что рисунок на цветных областях на 3-мерном симплексе выше выглядит (и должен быть) диаграммой Вороного. Один из способов (я надеюсь) вы можете подумать об этом как последовательность треугольника / симпекса Паскаля ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ). Если размеры цветных областей следуют за вторым рядом треугольника Паскаля во втором случае, за третьим рядом тетраэдра Паскаля в третьем случае и так далее. Это объяснило бы связь с многочленным распределением, но здесь я действительно в глубокой воде ...

Расмус Батх
источник
2
весело! (Как обычно.) Но я скучаю по носкам.
Сиань
Ну, я начал рисовать носки с заменой. Но потом я начал думать о Байесовском усилителе, одно привело к другому, и вот как я здесь оказался :)
Расмус Бат
2
@ Сиань, может быть, именно байки, а не щенки, должны стать талисманом Байеса?
Тим

Ответы:

14

Эти два распределения различны для каждого .n4

нотация

Я собираюсь изменить ваш симплекс на коэффициент , чтобы точки решетки имели целочисленные координаты. Это ничего не меняет, я просто думаю, что это делает запись немного менее громоздкой.n

Пусть - -симплекс, заданный как выпуклая оболочка точек , ..., в . Другими словами, это точки, где все координаты неотрицательны, и где координаты суммируются с .( n - 1 ) ( n , 0 , , 0 ) ( 0 , , 0 , n ) R n nS(n1)(n,0,,0)(0,,0,n)Rnn

Обозначим через множество точек решетки , т. Е. Тех точек в где все координаты целые.SΛS

Если - точка решетки, мы обозначим ее ячейку Вороного , определенную как те точки в которые (строго) ближе к чем к любой другой точке в .V P S P ΛPVPSPΛ

Мы ставим два вероятностных распределения, которые мы можем поместить в . Одним из них является полиномиальное распределение, где точка имеет вероятность . Другой мы будем называть моделью Дирихле , и она назначает каждому вероятность, пропорциональную объему .( 1 , . . . , П ) 2 - п п ! / ( a 1 ! a n ! ) P Λ V PΛ(a1,...,an)2nn!/(a1!an!)PΛVP

Очень неформальное оправдание

Я утверждаю, что полиномиальная модель и модель Дирихле дают разные распределения на , когда .n 4Λn4

Чтобы увидеть это, рассмотрим случай , а точки и . Я утверждаю, что и конгруэнтны посредством перевода вектором . Это означает, что и имеют одинаковый объем, и, следовательно, и имеют одинаковую вероятность в модели Дирихле. С другой стороны, в полиномиальной модели они имеют разные вероятности ( И ), И это Отсюда следует, что распределения не могут быть равными.A = ( 2 , 2 , 0 , 0 ) B = ( 3 , 1 , 0 , 0 ) V A V B ( 1 , - 1 , 0 , 0 ) V A V B A B 2 - 44 ! / ( 2 ! 2 ! ) 2 - 4n=4A=(2,2,0,0)B=(3,1,0,0)VAVB(1,1,0,0)VAVBAB244!/(2!2!)244!/3!

Тот факт, что и совпадают, следует из следующего правдоподобного, но неочевидного (и несколько расплывчатого) утверждения:V BVAVB

Правдоподобное утверждение : На форму и размер влияют только «непосредственные соседи» (т. Те точки в которые отличаются от вектором, который выглядит как , где и могут быть в других местах) P Λ P ( 1 , - 1 , 0 , , 0 ) 1 - 1VPPΛP(1,1,0,,0)11

Легко видеть, что конфигурации «непосредственных соседей» и одинаковы, и из этого следует, что и являются конгруэнтными.B V A V BABVAVB

В случае , мы можем играть в ту же игру, с и , например.A = ( 2 , 2 , n - 4 , 0 , , 0 ) B = ( 3 , 1 , n - 4 , 0 , , 0 )n5A=(2,2,n4,0,,0)B=(3,1,n4,0,,0)

Я не думаю, что это утверждение совершенно очевидно, и я не собираюсь доказывать это, вместо немного другой стратегии. Тем не менее, я думаю, что это более интуитивный ответ на вопрос, почему распределения отличаются для .n4

Строгое доказательство

Возьмите и как в неофициальном обосновании выше. Нам нужно только доказать, что и конгруэнтны.B V A V BABVAVB

Учитывая , мы определим следующим образом: - это множество точек , для которых . (В более удобной форме: пусть . - множество точек, для которых разница между самым высоким и самым низким меньше 1.)Ш Р Ш Р ( х 1 , ... , х п ) S макс 1 я п ( а я - р я ) - мин 1 я п ( а , i - p i ) < 1 v i = aP=(p1,,pn)ΛWPWP(x1,,xn)Smax1in(aipi)min1in(aipi)<1W P v ivi=aipiWPvi

Покажем, что .VP=WP

Шаг 1

: .VPWP

Это довольно просто: предположим, что отсутствует в . Пусть и предположим (без ограничения общности), что , . Поскольку , мы также знаем, что .W P v i = x i - p i v 1 = max 1 i n v i v 2 = min 1 i n v i v 1 - v 21 Σ п я = 1 v я = 0 V 1X=(x1,,xn)WPvi=xipiv1=max1inviv2=min1inviv1v21i=1nvi=0v1>0>v2

Пусть теперь . Так как и оба имеют неотрицательные координаты, то и , и поэтому и, следовательно, . С другой стороны, . Таким образом, по крайней мере так же близко к как и к , поэтому . Это показывает (принимая дополнения), что .Р Х Q Q S Q Л d я сек т 2 ( Х , P ) - d я сек т 2 ( X , Q ) = v 2 1 + v 2 2 - (Q=(p1+1,p21,p3,,pn)PXQQSQΛX Q P X V P V pW Pdist2(X,P)dist2(X,Q)=v12+v22(1v1)2(1+v2)2=2+2(v1v2)0XQPXVPVpWP

Шаг 2

Требование : попарно не пересекаются.WP

Предположим иначе. Пусть и - разные точки в , и пусть . Поскольку и различны и оба в , должен быть один индекс где , и один, где . Без ограничения общности будем считать, что , а . Переставляя и складывая вместе, мы получаем .P=(p1,,pn)Λ X W PW Q P Q Λ i p iq i + 1 p iq i - 1 p 1q 1 + 1 p 2q 2 -Q=(q1,,qn)ΛXWPWQPQΛipiqi+1piqi1p1q1+1q 1 - p 1 + p 2 - q 22p2q21q1p1+p2q22

Теперь рассмотрим числа и . Из того факта, что , мы имеем . Аналогично, подразумевает, что . Сложив их вместе, мы получим , и мы получим противоречие.x1 X W P x 1 - p 1 - ( x 2 - p 2 ) < 1 X W Q x 2 - q 2 - ( x 1 - q 1 ) < 1 q 1 - p 1 + p 2 - q 2 < 2x2XWPx1p1(x2p2)<1XWQx2q2(x1q1)<1q1p1+p2q2<2

Шаг 3

Мы показали, что и что не пересекаются. крышка до множества меры нуль, и из этого следует , что ( с точностью до множества меры нуль). [Поскольку и оба открыты, мы фактически имеем , но это не обязательно.]W P V P S W P = V P W P V P W P = V PVPWPWPVPSWP=VPWPVPWP=VP

Теперь мы почти закончили. Рассмотрим точки и . Легко видеть, что и являются конгруэнтными и переводят друг друга: единственный способ, которым они могут отличаться, - это если граница (кроме граней, на которых лежат и ) будет «обрезана» или или но не другой. Но чтобы достичь такой части границы , нам нужно изменить одну координату или как минимум на 1, что будет достаточно, чтобы гарантировать, что мы изB = ( 3 , 1 , n - 4 , 0 , , 0 ) W A W B S A B W A W B S A B W A W B S A B W A W B W AA=(2,2,n4,0,,0)B=(3,1,n4,0,,0)WAWBSABWAWBSABWAи любом случае. Таким образом, даже если действительно отличается от точек обзора и , различия слишком , чтобы их можно было определить по определениям и , и, следовательно, и конгруэнтны.WBSABWAWBWAWB

Из этого следует, что и имеют одинаковый объем, и, таким образом, модель Дирихле назначает им одинаковую вероятность, даже если они имеют разные вероятности в полиномиальной модели.V BVAVB

Ж. Лю
источник
Вау, строгий! Благодарность! Так что легкая переписка, на которую я надеялся, была случайной, я думаю ...
Расмус Бат