Каково распределение евклидова расстояния между двумя нормально распределенными случайными величинами?

42

Предположим, вам даны два объекта, точное местоположение которых неизвестно, но они распределены в соответствии с обычным распределением с известными параметрами (например, и . Мы можем предположить, что это обе двумерные нормали, так что позиции описываются распределением по координатам (т. Е. и - векторы, содержащие ожидаемые координаты для и соответственно). Мы также будем предполагать, что объекты независимы.Ь ~ N ( V , трет ) ) ( х , у ) т va~N(м,s)б~N(v,T))(Икс,Y)мv(Икс,Y)aб

Кто-нибудь знает, является ли распределение евклидова расстояния в квадрате между этими двумя объектами известным параметрическим распределением? Или как получить PDF / CDF для этой функции аналитически?

Ник
источник
4
Вы должны получить кратное нецентрального распределения хи-квадрат, если все четыре координаты не коррелированы. В противном случае результат выглядит намного сложнее.
whuber
@whuber любые подробности / указатели, которые вы могли бы предоставить относительно того, как параметры получающегося нецентрального распределения хи-квадрат соотносятся с параметрами объектов a, b, это было бы фантастически
Ник
4
@ Ник первые несколько параграфов статьи Wikipedia предоставляют подробности. Глядя на характерных функциях , которые вы можете установить , что подобный результат не доступен , если не все дисперсии одинаковы или есть некоторые корреляции.
whuber
@ Ник, просто чтобы уточнить, и - случайные векторы со значениями в ? aбр2
mpiktas
1
@ Ник, если и вместе нормальны, то разница нормальна. Тогда ваша задача - найти распределение случайного нормального вектора. Погуглил я нашел эту ссылку . В статье описывается гораздо более сложная проблема, которая в очень конкретном случае совпадает с вашей. Это дает некоторую надежду, что есть определенный ответ на ваш вопрос. Ссылки могут дать вам дополнительные идеи, где искать. б а - бaбa-б
mpiktas

Ответы:

24

Ответ на этот вопрос можно найти в книге « Квадратичные формы в случайных величинах», написанной Mathai and Provost (1992, Marcel Dekker, Inc.).

Как поясняется в комментариях, вам нужно найти распределение где z = a - b следует двумерному нормальному распределению со средним μ и ковариационной матрицей Σ . Это квадратичная форма в двумерной случайной величины z .Qзнак равноZ12+Z22Zзнак равноa-бμΣZ

Вкратце, один хороший общий результат для мерного случая, когда z N p ( µ , Σ ) и Q = p j = 1 z 2 j, состоит в том, что функция, производящая момент, равна E ( e t Q ) = e t p j = 1 b 2 j λ jпZ~Nп(μ,Σ)

Q=j=1pzj2
гдеλ1,...,λрсобственныеЕиЬявляется линейной функцией отц. См. Теорему 3.2a.2 (стр. 42) в цитированной выше книге (здесь мы предполагаем, чтоΣнеособа). Другое полезное представление 3.1a.1 (стр. 29) Q=pj=1
E(etQ)=etΣJзнак равно1пбJ2λJ1-2TλJΠJзнак равно1п(1-2TλJ)-1/2
λ1,...,λпΣбμΣ где u 1 , , u p - это N ( 0 , 1 ) .
Qзнак равноΣJзнак равно1пλJ(UJ+бJ)2
U1,...,UпN(0,1)

Вся глава 4 в книге посвящена представлению и вычислению плотностей и функций распределения, что вовсе не тривиально. Я только поверхностно знаком с книгой, но у меня сложилось впечатление, что все общие представления в терминах бесконечных разложений в ряды.

λ1,λ2>0б1,б2р

aбa-б

NRH
источник
1
Спасибо за ссылку, я нашел книгу и медленно пытаюсь пробраться через нее
Ник
λJзнак равноσ2пзнак равно2бJ2λJμJ2
бJμJ2
7

μdзнак равноμ1-μ2Σdзнак равноΣ1+Σ2 Σdзнак равноJΣ12JTΣ12знак равно[Σ1Σ2]Jзнак равно[+я,-я]

Во-вторых, обратите внимание на распределение длины разностного вектора или радиального расстояния от начала координат, которое распределено Хойтом :

Радиус вокруг истинного среднего в двумерной коррелированной нормальной случайной переменной с неравными дисперсиями, переписанной в полярных координатах (радиус и угол), следует распределению Хойта. Pdf и cdf определены в закрытом виде, числовой корень используется для поиска cdf ^ −1. Сводится к распределению Рэлея, если корреляция равна 0, а дисперсии равны.

Более общее распределение возникает, если учесть смещенную разницу (смещенное происхождение) из баллистипедии : Распределение xy-координат и результирующая радиальная ошибка

Фелипе Георгиевич Невински
источник
2
+1, но я думаю, что стоит отметить, что вопрос касается того, что ваша фигура называет «общим делом».
говорит амеба: восстанови Монику
1

Почему бы не проверить это?

set.seed(347)
x <- rnorm(10000)
y <- rnorm(10000)
x2 <- rnorm(10000)
y2 <- rnorm(10000)

qdf <- data.frame(x,y,x2,y2)
qdf <- data.frame(qdf,(x-x2)^2+(y-y2)^2)
colnames(qdf)[5] <- "euclid" 

plot(c(x,y),c(x2,y2))
plot(qdf$euclid)
hist(qdf$euclid) 
plot(dentist(qdf$euclid))

Участок 1 Участок 2 Участок 3 Сюжет 4

Брэндон Бертельсен
источник
2
В комментариях к первоначальному вопросу уже говорилось, как бы выглядело, если бы различия были одинаковыми, а переменные не коррелированными. Возможно, привести пример, где это не так, было бы более поучительным.
Энди W
Можете ли вы привести такой пример?
Брэндон Бертельсен
все, что вам нужно сделать, это сгенерировать значения x и y, которые либо коррелированы, либо имеют разные отклонения. Различные отклонения могут быть сделаны прямо в коде, как есть. Вы можете генерировать значения из указанной ковариационной матрицы, используя mvrnorm из пакета MASS. Также я не уверен, что функция "дантист" в приведенном выше коде, если это, возможно, "плотность".
Энди W
1
При этом, вероятно, столь же поучительно работать с математикой, чтобы понять, почему это так (и как манипулирование дисперсией / ковариациями изменит распределение). Мне не совсем понятно, почему это так, просто взглянув на характерную функцию, упомянутую whuber. Похоже, что простое понимание правил сложения, вычитания и умножения случайных величин поможет вам понять, почему это так.
Энди W