Распределение скалярных произведений двух случайных единичных векторов в измерениях

27

Если и являются двумя независимыми случайными единичными векторами в (равномерно распределенными по единичной сфере), каково распределение их скалярного произведения (точечного произведения) ?xyRDxy

Я думаю, что по мере роста распределение быстро (?) Становится нормальным с нулевым средним и уменьшением дисперсии в более высоких измерениях но существует ли явная формула для \ сигма ^ 2 (D) ?D

limDσ2(D)0,
σ2(D)

Обновить

Я провел несколько быстрых симуляций. Во-первых, генерируя 10000 пар случайных единичных векторов для D=1000 легко увидеть, что распределение их точечных произведений совершенно гауссово (на самом деле это уже довольно гауссово уже для D=100 ), см. Подзаговор слева. Во-вторых, для каждого D диапазоне от 1 до 10000 (с увеличением шага) я генерировал 1000 пар и вычислял дисперсию. Билогарифмической график показан справа, и ясно , что формула очень хорошо аппроксимировать 1/D . Обратите внимание, что для D=1 и D=2 эта формула даже дает точные результаты (но я не уверен, что произойдет позже).

произведения точек между случайными единичными векторами

амеба говорит восстановить монику
источник
@KarlOskar: спасибо, эта ссылка очень актуальна, и фактически делает мой вопрос почти дубликатом, но не совсем. Таким образом, существует явная формула для которая является кумулятивной функцией распределения точечных произведений. Можно взять производную, чтобы получить PDF, а затем изучить предел . Тем не менее, формула дана в терминах бета-функций и неполных бета-функций, поэтому вычисления, вероятно, будут неприятными. P{(x,y)>ϵ}D
говорит амеба, восстановите Монику
@KarlOskar: от равномерного распределения на единичной сфере в . Чтобы сгенерировать случайный вектор из этого распределения, можно сгенерировать случайный вектор из гауссиана с единичной дисперсией, а затем нормализовать его. RD
говорит амеба, восстанови Монику

Ответы:

30

Поскольку ( как известно ) равномерное распределение на единичной сфере получается путем нормализации вариативного нормального распределения, а скалярное произведение нормализованных векторов является их коэффициентом корреляции, ответы на три вопросы:SD1Dt

  1. u=(t+1)/2 имеет распределение бета .((D1)/2,(D1)/2)

  2. Дисперсия равна (как предполагается в вопросе).t1/D

  3. Стандартизированное распределение приближается к нормальности со скоростьюtO(1D).


метод

Точное распределение скалярного произведения единичных векторов легко получается геометрический, так как это компонент второго вектора в направлении первого. Поскольку второй вектор не зависит от первого и равномерно распределен по единичной сфере, его компонент в первом направлении распределяется так же, как любая координата сферы. (Обратите внимание, что распределение первого вектора не имеет значения.)

Нахождение плотности

Если эта координата будет последней, плотность при , следовательно, пропорциональна площади поверхности, лежащей на высоте между и на единичной сфере. Эта пропорция происходит в поясе высотой и радиусом который по существу является коническим усечением, построенным из радиуса высоты и склона . Откуда вероятность пропорциональнаt[1,1]tt+dtdt1t2,SD21t2,dt1/1t2

(1t2)D21t2dt=(1t2)(D3)/2dt.

Полагая влечет за собой . Подстановка этого в предыдущее дает элемент вероятности до нормализующей постоянной:u=(t+1)/2[0,1]t=2u1

fD(u)du(1(2u1)2)(D3)/2d(2u1)=2D2(uu2)(D3)/2du.

Непосредственно, что имеет распределение Beta , потому что (по определению) его плотность также пропорциональнаu=(t+1)/2((D1)/2,(D1)/2)

u(D1)/21(1u)(D1)/21=(uu2)(D3)/2fD(u).

Определение предельного поведения

Информация об ограничивающем поведении легко вытекает из этого с использованием элементарных методов: может быть интегрирована для получения константы пропорциональности ; можно интегрировать (например, используя свойства бета-функций) для получения моментов, показывающих, что дисперсия равна и уменьшается до (откуда, согласно теореме Чебышева, вероятность концентрируется вблизи ); и затем определяется предельное распределение, учитывая значения плотности стандартизированного распределения, пропорционального для малых значенийfDΓ(n2)πΓ(D12)tkfD(t)1/D0t=0fD(t/D),t :

log(fD(t/D))=C(D)+D32log(1t2D)=C(D)(1/2+32D)t2+O(t4D)C12t2

где представляют (логарифмические) константы интегрирования. Очевидно, что скорость, с которой это приближается к нормальности (для которой плотность бревен равна ), равнаC12t2O(1D).

фигура

На этом графике показаны плотности точечного произведения для , стандартизированные по единичной дисперсии, и их предельная плотность. Значения в увеличиваются с ростом (от синего до красного, золотого, а затем зеленого для стандартной нормальной плотности). При этом разрешении плотность для будет неотличима от нормальной плотности.D=4,6,100DD=1000

Whuber
источник
4
(+1) Большое спасибо, @whuber, это отличный ответ! Отдельное спасибо за упоминание слова "усеченный". Случилось так, что я принял другой ответ за несколько минут до того, как вы опубликовали свой, и я не хотел бы сейчас отменять его; надеюсь ты понимаешь. Жаль, что невозможно принять оба! Кстати, обратите внимание на очень простое доказательство выражения для дисперсии из этого ответа: его можно увидеть непосредственно, не возиться с бета-функциями! Дисперсия точечного произведения равна дисперсии любой сферной координаты (как вы написали), и сумма всех из них должна быть , QED1/DD1
амеба говорит Восстановить Монику
1
Это хорошее наблюдение за отклонениями.
whuber
2
@amoeba, недавняя активность снова привлекла мое внимание и здесь, и насколько я ценю, что ты принял мой ответ, этот гораздо более полный. Я не против, если ты изменился.
ekvall
1
@ Student001: это справедливый и щедрый комментарий. Я переключил принятый ответ. Я также нашел один вопрос Q и один ваш, чтобы восполнить это, чтобы восполнить это :)
говорит амеба Восстановить Монику
1
@mat Распределение это распределение . Это делает его бета-распределением, которое масштабируется и сдвигается из интервала в интервал . t2U1[0,1][1,1]
whuber
11

Давайте найдем распределение, и тогда дисперсия будет следовать стандартным результатам. Рассмотрим векторное произведение и запишите его в форме косинуса, т.е. обратите внимание, что где - угол между и . На последнем шаге я использовал это для любых событий иТеперь рассмотрим термин . Ясно, что, поскольку выбран равномерно по отношению к поверхности сферы, не имеет значения, какой

P(xyt)=P(|x||y|cosθt)=P(cosθt)=EP(cosθty),
θxyAB
EP(AB):=E[E[χAB]]=EχA=P(A).
P(cosθty)xyна самом деле, только угол между и имеет значение. Таким образом, термин внутри ожидания на самом деле постоянен как функция от и мы можем предположить, чтоТогда мы получаем, чтоно поскольку является первой координатой нормализованного гауссовского вектора в мы получаем, что является гауссовским с дисперсией , вызывая асимптотический результат этой статьи .xyyy=[1,0,0,].
P(xyt)=P(x1t).
x1Rn,xy1/n

Для явного результата дисперсии используйте тот факт, что скалярное произведение равно нулю по независимости и, как показано выше, распределено как первая координата . По этим результатам поиск равносилен поиску . Теперь обратите внимание, что для каждой конструкции и поэтому мы можем написать где последнее равенство следует из того, что координаты одинаково распределены. Собрав все воедино, мы обнаружили, чтоxVar(xy)Ex12xx=1

1=Exx=Ei=1nxi2=i=1nExi2=nEx12,
xVar(xy)=Ex12=1/n
ekvall
источник
Спасибо, но я в замешательстве: что такое «желаемый результат» и как он вытекает из последнего уравнения? Окончательное распределение вероятностей должно зависеть от . D
говорит амеба: восстанови монику
На самом деле то, как результат следует из вашего последнего уравнения, именно то, что обсуждается в потоке math.SE, который вы нашли. Он включает в себя бета-дистрибутивы и т. Д., И ограничение поведения (для меня) далеко не очевидно. Я предполагаю , что должен быть более простой прямой путь , чтобы увидеть , что . σ2(D)1/D
говорит амеба, восстанови Монику
Это зависит от размерности, поскольку , где - сгенерированный гауссовский вектор. Я обновлю ответ позже сегодня или завтра. x1=z1|z|1z
ekvall
Ух ты, здорово, ваша последняя ссылка обеспечивает предел этого выражения , включающее обратные бета - функцию (которые я побоялся вычисления) в третьем уравнении на странице 1. Итак , чтобы завершить рассуждение: если сфера имеет радиус , тогда (асимптотически) распределяется как . Это означает , что для сферы радиуса единицы дисперсии раз меньше, то есть . Тем не менее, у меня все еще есть проблема: я проверил на от 1 до 4, и кажется, дает точную дисперсию, даже если распределения для D = 1 или D = 2 очень далеки от нормальных. За этим должна быть более глубокая причина. Dx1N(0,1)D1/DD1/D
Амеба говорит Восстановить Монику
@amoeba Да, обновлено с доказательством этого.
ekvall
2

Чтобы ответить на первую часть вашего вопроса, обозначим . Определение Произведение элементов из и обозначается здесь , как будут распределены в соответствии с совместным распределением и . так как , Z=X,Y=XiYi

fZi(zi)=fZ1,,ZD(z1,,zD)dzi
ithXYZiXiYi
fZi(zi)=fXi,Yi(x,zix)1|x|dx
Z=Zi
fZ(z)=fZ1,,ZD(z1,,zd)δ(zzi)dz1dzd

Во второй части, я думаю, что если вы хотите сказать что-нибудь интересное об асимптотическом поведении вам нужно, по крайней мере, предположить независимость и , а затем применить CLT.σXY

Например, если вы хотите предположить, что с и вы можете скажем, что и .{Z1,,ZD}E[Zi]=μV[Zi]=σ2σ2(D)=σ2DlimDσ2(D)=0

Том
источник
Спасибо, но я запутался во второй части. и , конечно, должны быть независимыми, я добавлю это к вопросу. Вы говорите, что , и это звучит разумно, но каково асимптотическое поведение ? Я думаю , что выражение , которое я ищу должно зависеть только от . Между прочим, в 2D если я не ошибаюсь, мне интересно, остается ли это верным в более высоких измерениях ...XYσ2(D)=Var(zi)/DVar(zi)DVar(zi)=1/2
говорит амеба Восстановить Монику
Действительно ли возможно, чтобы был независимым, учитывая, что и имеют единичную длину? ziXY
ekvall
@tom: Кстати, я был ошибочно: в 2D равен 1, то , которое равно 1/2. Я обновил свой вопрос с некоторыми результатами моделирования. Похоже , правильная формула . Var(zi)Var(z)1/D
говорит амеба, восстанови Монику