Так что этот вопрос немного запутанный, но я добавлю красочные графики, чтобы восполнить это! Сначала предыстория, затем вопрос (ы).
Задний план
Скажем, у вас есть мерное полиномиальное распределение с равными вероятностями по категориям. Пусть - нормализованные значения ( ) из этого распределения, то есть:
Теперь распределение по имеет поддержку по симплексу, но с дискретными шагами. Например, при этот дистрибутив имеет следующую поддержку (красные точки):
Другим распределением с аналогичной поддержкой является мерное распределение , то есть равномерное распределение по единичному симплексу. Например, вот случайные ничьи из 3-мерного :Дирихле ( 1 , … , 1 ) Дирихле ( 1 , 1 , 1 )
Теперь у меня появилась идея, что распределение из распределения можно охарактеризовать как отрисовки из , которые дискретизируются до дискретной поддержки . Дискретизация, которую я имел в виду (и которая, кажется, работает хорошо), состоит в том, чтобы взять каждую точку симплекса и «округлить ее» до ближайшей точки, которая находится в поддержке . Для трехмерного симплекса вы получите следующий раздел, где точки в каждой цветной области должны «округляться» до ближайшей красной точки:Многочлен ( 1 / n , … , 1 / n ) Дирихле ( 1 , … , 1 ) π π
Поскольку распределение Дирихле является равномерным, результирующая плотность / вероятность для каждой из точек пропорциональна площади / объему, который «округляется» до каждой точки. Для двумерного и трехмерного случаев эти вероятности:
( эти вероятности взяты из моделирования Монте-Карло )
Таким образом, кажется, что, по крайней мере для 2 и 3 измерений, полученное распределение вероятностей от дискретизации таким конкретным способом совпадает с распределением вероятности для . Это нормализованный результат распределения . Я также пробовал с 4-мя измерениями, и, похоже, там работает.π Многочлен ( 1 / n , … , 1 / n )
Вопросов)
Итак, мой главный вопрос:
Дискретизируя однородный Дирихле таким конкретным способом, имеет ли отношение отношение для дальнейших измерений? Отношение имеет место вообще? (Я пробовал это только с помощью симуляции Монте-Карло ...)
Дальше мне интересно:
- Если это соотношение верно, это известный результат? И есть ли какой-нибудь источник, который я могу процитировать для этого?
- Если эта дискретизация равномерного Дирихле не имеет этого отношения с Мультивиномом. Есть ли подобная конструкция, которая имеет?
Некоторый контекст
Моя причина для того, чтобы задать этот вопрос, заключается в том, что я смотрю на сходство непараметрического Bootstrap и байесовского Bootstrap, и затем это выяснилось. Я также заметил, что рисунок на цветных областях на 3-мерном симплексе выше выглядит (и должен быть) диаграммой Вороного. Один из способов (я надеюсь) вы можете подумать об этом как последовательность треугольника / симпекса Паскаля ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ). Если размеры цветных областей следуют за вторым рядом треугольника Паскаля во втором случае, за третьим рядом тетраэдра Паскаля в третьем случае и так далее. Это объяснило бы связь с многочленным распределением, но здесь я действительно в глубокой воде ...
Ответы:
Эти два распределения различны для каждого .n≥4
нотация
Я собираюсь изменить ваш симплекс на коэффициент , чтобы точки решетки имели целочисленные координаты. Это ничего не меняет, я просто думаю, что это делает запись немного менее громоздкой.n
Пусть - -симплекс, заданный как выпуклая оболочка точек , ..., в . Другими словами, это точки, где все координаты неотрицательны, и где координаты суммируются с .( n - 1 ) ( n , 0 , … , 0 ) ( 0 , … , 0 , n ) R n nS (n−1) (n,0,…,0) (0,…,0,n) Rn n
Обозначим через множество точек решетки , т. Е. Тех точек в где все координаты целые.SΛ S
Если - точка решетки, мы обозначим ее ячейку Вороного , определенную как те точки в которые (строго) ближе к чем к любой другой точке в .V P S P ΛP VP S P Λ
Мы ставим два вероятностных распределения, которые мы можем поместить в . Одним из них является полиномиальное распределение, где точка имеет вероятность . Другой мы будем называть моделью Дирихле , и она назначает каждому вероятность, пропорциональную объему .( 1 , . . . , П ) 2 - п п ! / ( a 1 ! ⋯ a n ! ) P ∈ Λ V PΛ (a1,...,an) 2−nn!/(a1!⋯an!) P∈Λ VP
Очень неформальное оправдание
Я утверждаю, что полиномиальная модель и модель Дирихле дают разные распределения на , когда .n ≥ 4Λ n≥4
Чтобы увидеть это, рассмотрим случай , а точки и . Я утверждаю, что и конгруэнтны посредством перевода вектором . Это означает, что и имеют одинаковый объем, и, следовательно, и имеют одинаковую вероятность в модели Дирихле. С другой стороны, в полиномиальной модели они имеют разные вероятности ( И ), И это Отсюда следует, что распределения не могут быть равными.A = ( 2 , 2 , 0 , 0 ) B = ( 3 , 1 , 0 , 0 ) V A V B ( 1 , - 1 , 0 , 0 ) V A V B A B 2 - 4 ⋅ 4 ! / ( 2 ! 2 ! ) 2 - 4n=4 A=(2,2,0,0) B=(3,1,0,0) VA VB (1,−1,0,0) VA VB A B 2−4⋅4!/(2!2!) 2−4⋅4!/3!
Тот факт, что и совпадают, следует из следующего правдоподобного, но неочевидного (и несколько расплывчатого) утверждения:V BVA VB
Правдоподобное утверждение : На форму и размер влияют только «непосредственные соседи» (т. Те точки в которые отличаются от вектором, который выглядит как , где и могут быть в других местах) P Λ P ( 1 , - 1 , 0 , … , 0 ) 1 - 1VP P Λ P (1,−1,0,…,0) 1 −1
Легко видеть, что конфигурации «непосредственных соседей» и одинаковы, и из этого следует, что и являются конгруэнтными.B V A V BA B VA VB
В случае , мы можем играть в ту же игру, с и , например.A = ( 2 , 2 , n - 4 , 0 , … , 0 ) B = ( 3 , 1 , n - 4 , 0 , … , 0 )n≥5 A=(2,2,n−4,0,…,0) B=(3,1,n−4,0,…,0)
Я не думаю, что это утверждение совершенно очевидно, и я не собираюсь доказывать это, вместо немного другой стратегии. Тем не менее, я думаю, что это более интуитивный ответ на вопрос, почему распределения отличаются для .n≥4
Строгое доказательство
Возьмите и как в неофициальном обосновании выше. Нам нужно только доказать, что и конгруэнтны.B V A V BA B VA VB
Учитывая , мы определим следующим образом: - это множество точек , для которых . (В более удобной форме: пусть . - множество точек, для которых разница между самым высоким и самым низким меньше 1.)Ш Р Ш Р ( х 1 , ... , х п ) ∈ S макс 1 ≤ я ≤ п ( а я - р я ) - мин 1 ≤ я ≤ п ( а , i - p i ) < 1 v i = aP=(p1,…,pn)∈Λ WP WP (x1,…,xn)∈S max1≤i≤n(ai−pi)−min1≤i≤n(ai−pi)<1 W P v ivi=ai−pi WP vi
Покажем, что .VP=WP
Шаг 1
: .VP⊆WP
Это довольно просто: предположим, что отсутствует в . Пусть и предположим (без ограничения общности), что , . Поскольку , мы также знаем, что .W P v i = x i - p i v 1 = max 1 ≤ i ≤ n v i v 2 = min 1 ≤ i ≤ n v i v 1 - v 2 ≥ 1 Σ п я = 1 v я = 0 V 1X=(x1,…,xn) WP vi=xi−pi v1=max1≤i≤nvi v2=min1≤i≤nvi v1−v2≥1 ∑ni=1vi=0 v1>0>v2
Пусть теперь . Так как и оба имеют неотрицательные координаты, то и , и поэтому и, следовательно, . С другой стороны, . Таким образом, по крайней мере так же близко к как и к , поэтому . Это показывает (принимая дополнения), что .Р Х Q Q ∈ S Q ∈ Л d я сек т 2 ( Х , P ) - d я сек т 2 ( X , Q ) = v 2 1 + v 2 2 - (Q=(p1+1,p2−1,p3,…,pn) P X Q Q∈S Q∈Λ X Q P X ∉ V P V p ⊆ W Pdist2(X,P)−dist2(X,Q)=v21+v22−(1−v1)2−(1+v2)2=−2+2(v1−v2)≥0 X Q P X∉VP Vp⊆WP
Шаг 2
Требование : попарно не пересекаются.WP
Предположим иначе. Пусть и - разные точки в , и пусть . Поскольку и различны и оба в , должен быть один индекс где , и один, где . Без ограничения общности будем считать, что , а . Переставляя и складывая вместе, мы получаем .P=(p1,…,pn) Λ X ∈ W P ∩ W Q P Q Λ i p i ≥ q i + 1 p i ≤ q i - 1 p 1 ≥ q 1 + 1 p 2 ≤ q 2 -Q=(q1,…,qn) Λ X∈WP∩WQ P Q Λ i pi≥qi+1 pi≤qi−1 p1≥q1+1 q 1 - p 1 + p 2 - q 2 ≥ 2p2≤q2−1 q1−p1+p2−q2≥2
Теперь рассмотрим числа и . Из того факта, что , мы имеем . Аналогично, подразумевает, что . Сложив их вместе, мы получим , и мы получим противоречие.x1 X ∈ W P x 1 - p 1 - ( x 2 - p 2 ) < 1 X ∈ W Q x 2 - q 2 - ( x 1 - q 1 ) < 1 q 1 - p 1 + p 2 - q 2 < 2x2 X∈WP x1−p1−(x2−p2)<1 X∈WQ x2−q2−(x1−q1)<1 q1−p1+p2−q2<2
Шаг 3
Мы показали, что и что не пересекаются. крышка до множества меры нуль, и из этого следует , что ( с точностью до множества меры нуль). [Поскольку и оба открыты, мы фактически имеем , но это не обязательно.]W P V P S W P = V P W P V P W P = V PVP⊆WP WP VP S WP=VP WP VP WP=VP
Теперь мы почти закончили. Рассмотрим точки и . Легко видеть, что и являются конгруэнтными и переводят друг друга: единственный способ, которым они могут отличаться, - это если граница (кроме граней, на которых лежат и ) будет «обрезана» или или но не другой. Но чтобы достичь такой части границы , нам нужно изменить одну координату или как минимум на 1, что будет достаточно, чтобы гарантировать, что мы изB = ( 3 , 1 , n - 4 , 0 , … , 0 ) W A W B S A B W A W B S A B W A W B S A B W A W B W AA=(2,2,n−4,0,…,0) B=(3,1,n−4,0,…,0) WA WB S A B WA WB S A B WA и любом случае. Таким образом, даже если действительно отличается от точек обзора и , различия слишком , чтобы их можно было определить по определениям и , и, следовательно, и конгруэнтны.WB S A B WA WB WA WB
Из этого следует, что и имеют одинаковый объем, и, таким образом, модель Дирихле назначает им одинаковую вероятность, даже если они имеют разные вероятности в полиномиальной модели.V BVA VB
источник