Если и являются двумя независимыми случайными единичными векторами в (равномерно распределенными по единичной сфере), каково распределение их скалярного произведения (точечного произведения) ?
Я думаю, что по мере роста распределение быстро (?) Становится нормальным с нулевым средним и уменьшением дисперсии в более высоких измерениях но существует ли явная формула для \ сигма ^ 2 (D) ?
Обновить
Я провел несколько быстрых симуляций. Во-первых, генерируя 10000 пар случайных единичных векторов для легко увидеть, что распределение их точечных произведений совершенно гауссово (на самом деле это уже довольно гауссово уже для ), см. Подзаговор слева. Во-вторых, для каждого диапазоне от 1 до 10000 (с увеличением шага) я генерировал 1000 пар и вычислял дисперсию. Билогарифмической график показан справа, и ясно , что формула очень хорошо аппроксимировать . Обратите внимание, что для и эта формула даже дает точные результаты (но я не уверен, что произойдет позже).
источник
Ответы:
Поскольку ( как известно ) равномерное распределение на единичной сфере получается путем нормализации вариативного нормального распределения, а скалярное произведение нормализованных векторов является их коэффициентом корреляции, ответы на три вопросы:SD−1 D t
Дисперсия равна (как предполагается в вопросе).t 1/D
Стандартизированное распределение приближается к нормальности со скоростьюt O(1D).
метод
Точное распределение скалярного произведения единичных векторов легко получается геометрический, так как это компонент второго вектора в направлении первого. Поскольку второй вектор не зависит от первого и равномерно распределен по единичной сфере, его компонент в первом направлении распределяется так же, как любая координата сферы. (Обратите внимание, что распределение первого вектора не имеет значения.)
Нахождение плотности
Если эта координата будет последней, плотность при , следовательно, пропорциональна площади поверхности, лежащей на высоте между и на единичной сфере. Эта пропорция происходит в поясе высотой и радиусом который по существу является коническим усечением, построенным из радиуса высоты и склона . Откуда вероятность пропорциональнаt∈[−1,1] t t+dt dt 1−t2−−−−−√, SD−2 1−t2−−−−−√, dt 1/1−t2−−−−−√
Полагая влечет за собой . Подстановка этого в предыдущее дает элемент вероятности до нормализующей постоянной:u=(t+1)/2∈[0,1] t=2u−1
Непосредственно, что имеет распределение Beta , потому что (по определению) его плотность также пропорциональнаu=(t+1)/2 ((D−1)/2,(D−1)/2)
Определение предельного поведения
Информация об ограничивающем поведении легко вытекает из этого с использованием элементарных методов: может быть интегрирована для получения константы пропорциональности ; можно интегрировать (например, используя свойства бета-функций) для получения моментов, показывающих, что дисперсия равна и уменьшается до (откуда, согласно теореме Чебышева, вероятность концентрируется вблизи ); и затем определяется предельное распределение, учитывая значения плотности стандартизированного распределения, пропорционального для малых значенийfD Γ(n2)π√Γ(D−12) tkfD(t) 1/D 0 t=0 fD(t/D−−√), t :
где представляют (логарифмические) константы интегрирования. Очевидно, что скорость, с которой это приближается к нормальности (для которой плотность бревен равна ), равнаC −12t2 O(1D).
На этом графике показаны плотности точечного произведения для , стандартизированные по единичной дисперсии, и их предельная плотность. Значения в увеличиваются с ростом (от синего до красного, золотого, а затем зеленого для стандартной нормальной плотности). При этом разрешении плотность для будет неотличима от нормальной плотности.D=4,6,10 0 D D=1000
источник
Давайте найдем распределение, и тогда дисперсия будет следовать стандартным результатам. Рассмотрим векторное произведение и запишите его в форме косинуса, т.е. обратите внимание, что где - угол между и . На последнем шаге я использовал это для любых событий иТеперь рассмотрим термин . Ясно, что, поскольку выбран равномерно по отношению к поверхности сферы, не имеет значения, какой
Для явного результата дисперсии используйте тот факт, что скалярное произведение равно нулю по независимости и, как показано выше, распределено как первая координата . По этим результатам поиск равносилен поиску . Теперь обратите внимание, что для каждой конструкции и поэтому мы можем написать где последнее равенство следует из того, что координаты одинаково распределены. Собрав все воедино, мы обнаружили, чтоx Var(x′y) Ex21 x′x=1
источник
Чтобы ответить на первую часть вашего вопроса, обозначим . Определение Произведение элементов из и обозначается здесь , как будут распределены в соответствии с совместным распределением и . так как ,Z=⟨X,Y⟩=∑XiYi
Во второй части, я думаю, что если вы хотите сказать что-нибудь интересное об асимптотическом поведении вам нужно, по крайней мере, предположить независимость и , а затем применить CLT.σ X Y
Например, если вы хотите предположить, что с и вы можете скажем, что и .{Z1,…,ZD} E[Zi]=μ V[Zi]=σ2 σ2(D)=σ2D limD→∞σ2(D)=0
источник