Дисперсия произведения зависимых переменных

32

Какова формула для дисперсии произведения зависимых переменных?

В случае независимых переменных формула проста:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Но какова формула для коррелированных переменных?

Кстати, как я могу найти корреляцию на основе статистических данных?

Рига
источник

Ответы:

32

Ну, используя знакомую личность, которую вы указали,

var(XY)=E(X2Y2)E(XY)2

Используя аналогичную формулу для ковариации,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

а также

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

что подразумевает, что в общем случае можно записать какvar(XY)

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Обратите внимание, что в случае независимости cov(X2,Y2)=cov(X,Y)=0 и это сводится к

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

и два [E(X)E(Y)]2 условия отменяются, и вы получите

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

как вы указали выше.

Изменить: Если все, что вы наблюдаете, это а не и отдельности, то я не думаю, что у вас есть способ оценить или за исключением особых случаев (например, если имеют средства, которые известны априори )XYXYcov(X,Y)cov(X2,Y2)X,Y

макрос
источник
2
почему вместо E (X2) E (Y2) вы ставите [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] ???
1
@ user35458, поэтому он может в итоге получить уравнение в виде выражения var (X) и var (Y), что сравнимо с утверждением OP. Обратите внимание, что E (X ^ 2) = Var (X) + E (X) ^ 2.
Waldir Leoncio
2
Чтобы ответить (в автономном режиме) на теперь удаленный запрос на достоверность этого ответа, я сравнил его результаты с прямым расчетом дисперсии продукта во многих симуляциях. Это непрактичная формула, которую можно использовать, если вы можете ее избежать, потому что она может потерять существенную точность из-за отмены вычитания одного большого члена из другого - но это не главное. Следует опасаться, что этот вопрос касается случайных величин. Его результаты применяются к данным при условии, что вы вычисляете дисперсии и ковариации, используя знаменатели а неnn1 (как обычно для программного обеспечения).
whuber
14

Это дополнение к очень хорошему ответу @ Macro, в котором излагается именно то, что нужно знать, чтобы определить дисперсию произведения двух коррелированных случайных величин. Так как где , , , и

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y]E[X2]E[Y2] можно считать известными величинами, мы должны быть в состоянии определить значение в или в . В общем, это нелегко сделать, но, как уже указывалось, если и являются независимыми случайными величинами, то . На самом деле, ключевым фактором является зависимость, а не корреляция (или ее отсутствие). То, что мы знаем, что равно вместо некоторого ненулевого значения, само по себе неE[X2Y2](2)cov(X2,Y2)(3)XYcov(X,Y)=cov(X2,Y2)=0cov(X,Y)0помощь в крайней мере , в наших усилиях определения стоимости или , даже если он действительно упрощать правые части и немного.E[X2Y2]cov(X2,Y2)(2)(3)

Когда и являются зависимыми случайными величинами, то по меньшей мере в одном (довольно общем или довольно важном) особом случае, то это можно найти значение относительно легко.XYE[X2Y2]

Предположим, что и - совместно нормальные случайные величины с коэффициентом корреляции . Затем, кондиционером на , то условная плотность является нормальной плотности со средним и дисперсия . Таким образом, XYρX=xYE[Y]+ρvar(Y)var(X)(xE[X])var(Y)(1ρ2)

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
который является квартичной функцией , скажем, , и закон повторного ожидания говорит нам, что где правая часть может быть вычислена на основе знания 3-го и 4-го моментов - стандартных результатов, которые можно найти во многих текстах и ​​справочниках (то есть что мне лень их искать и включать в этот ответ).Xg(X)
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
(4)X

Дальнейшее добавление: в удаленном ответе @Hydrologist задает дисперсию как и утверждает, что эта формула это из двух работ, опубликованных полвека назад в JASA. Эта формула является неправильной транскрипцией результатов в статьях, цитируемых Гидрологом. В частности,XY

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
Cov[x2,y2]является ошибочной в статье журнала, и аналогично для и .E[(xE[x])2(yE[y])2]Cov[x2,y]Cov[x,y2]
Дилип Сарватэ
источник
Для вычисления в совместном нормальном случае, также см. Math.stackexchange.com/questions/668641/…E(X2Y2)
Сэмюэль Рид