Дисперсия произведения k коррелированных случайных величин

12

Какова дисперсия произведения коррелированных случайных величин?k

Джафар Мансури
источник

Ответы:

12

Больше информации по этой теме, чем вам, вероятно, требуется, можно найти в Goodman (1962): «Дисперсия произведения из K случайных величин » , который выводит формулы как для независимых случайных величин, так и для потенциально коррелированных случайных величин, а также некоторые приближения. В более ранней статье ( Goodman, 1960 ) была получена формула для произведения ровно двух случайных переменных, которая несколько проще (хотя и довольно грубая), так что, возможно, лучше начать ее, если вы хотите понять вывод ,

Для полноты, однако, это идет так.

Две переменные

Предположим следующее:

  • уx и две случайные величиныy
  • YX и - их (ненулевые) ожиданияY
  • V ( у )V(x) и - их дисперсииV(y)
  • δ yδx=(xX)/X (и аналогично для )δy
  • Di,j=E[(δx)i(δy)j]
  • Δ yΔx=xX (и аналогично для )Δy
  • Ei,j=E[(Δx)i(Δy)j]
  • V ( x ) / X 2 G ( Y )G(x) - квадрат коэффициента вариации: (аналогично для )V(x)/X2G(Y)

Тогда: или эквивалентно:

V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2D1,12]

V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12

Более двух переменных

В статье 1960 года предполагается, что это упражнение для читателя (что, по-видимому, мотивировало статью 1962 года!).

Обозначения похожи, с несколькими расширениями:

  • x y(x1,x2,xn) случайные величины вместо иxy
  • M=E(i=1kxi)
  • A=(M/i=1kXi)1
  • i = 1 , 2 , ksi = 0, 1 или 2 дляi=1,2,k
  • ( с 1 , с 2 , с к )u = количество в(s1,s2,sk)
  • ( с 1 , с 2 , с к )m = количество 2 в(s1,s2,sk)
  • m = 0 2 u m > 1D(u,m)=2u2 для и для ,m=02um>1
  • C(s1,s2,,sk)=D(u,m)E(i=1kδxisi)
  • 3 к - к - 1 ( ев 1 , ев 2 , ... s к ) 2 м + у > 1s1sk указывает суммирование наборов где3kk1(s1,s2,sk)2m+u>1

Тогда, наконец-то:

V(i=1kxi)=Xi2(s1skC(s1,s2sk)A2)

Смотрите документы для деталей и чуть более подходящих приближений!

Мэтт Краузе
источник
Обратите внимание, что приведенный выше ответ от Мэтта Краузе содержит ошибку, а также сам документ. В определении функции C (s1, ..., sk) это должно быть произведение, а не сумма.
Николас Гислер
Не могли бы вы уточнить немного больше? «Потому что я - анонимный человек из Интернета - так и скажи», на самом деле это не ответ ...
Тим
Если вы попытаетесь получить дисперсию var (x * y) для независимых случайных величин, то по формуле для произвольного k вы увидите, что только продукт, а не сумма дает вам правильный ответ. Кроме того, если вы посмотрите на бумагу, то сможете увидеть и ее, на странице 59 статьи (по крайней мере, в моей версии) он использовал продукт вместо суммы.
Николас Гислер
1
Для случая двух случайных величин в этом ответе @macro можно найти более легкую для чтения формулу для дисперсии произведения двух коррелированных случайных величин . Этот ответ также указывает на существенную проблему в есть чаща обозначений скрывает существенный факт, что в нем есть термины, значение которых невозможно определить, если мы не знаем cov или достаточно о совместной плотности двух случайных величин, чтобы определить эту величину.
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12,
(x2,y2)
Дилип Сарватэ
Предложение по редактированию, которое действительно должно было быть комментарием, предполагало, что оригинальный документ содержал опечатку, в которой были перепутаны сумма и произведение, и этот ответ должен быть исправлен. См. Stats.stackexchange.com/review/suggested-edits/83662
Серебряная
4

Просто чтобы добавить к удивительному ответу Мэтта Краузе (на самом деле его легко получить). Если x, y независимы, то

E1,1=E[(xE[x])(yE[y])]=Cov(x,y)=0E1,2=E[(xE[x])(yE[y])2]=E[xE(x)]E[(yE[y])2]=(E[x]E[x])E[(yE[y])2]=0E2,1=0E2,2=E[(xE[x])2(yE[y])2]=E[(xE[x])2]E[(yE[y])2=V[x]V[y]V[xy]=E[x]2V[y]+E[y]2V[x]+V[x]V[y]
Ананда
источник
1
Результат для случая независимых случайных величин обсуждался здесь . n
Дилип Сарватэ
3

В дополнение к общей формуле, данной Мэттом, стоит отметить, что существует несколько более явная формула для гауссовских случайных величин с нулевым средним. Это следует из теоремы Иссерлиса , см. Также высшие моменты для центрированного многомерного нормального распределения.

Предположим, что следует многомерному нормальному распределению со средним 0 и ковариационной матрицей . Если число переменных нечетное, и где означает сумму по всем разбиениям на непересекающихся пар причем каждый член является произведением соответствующих и где (x1,,xk)ΣkE(ixi)=0

V(ixi)=E(ixi2)=Σ~i,j
Σ{1,,2k}k{i,j}k Σ~i,j
Σ~=(ΣΣΣΣ)
- ковариационная матрица для . Если четное, то В случае получаем Если мы получаем где в сумме 15 членов.K V ( П я х я ) = V ( х 1 х 2 ) = Е 1 , 1 Е 2 , 2 + 2 ( Е 1 , 2 ) 2 - Е 2 1 , 2 = Σ 1 , 1(x1,,xk,x1,,xk)k
V(ixi)=Σ~i,j(Σi,j)2.
k=2
V(x1x2)=Σ1,1Σ2,2+2(Σ1,2)2Σ1,22=Σ1,1Σ2,2+(Σ1,2)2.
k=3
V(x1x2x3)=Σi,jΣk,lΣr,t,

Фактически возможно реализовать общую формулу. Самая сложная часть - это вычисление требуемых разделов. В R это можно сделать с помощью функции setpartsиз пакета partitions. Используя этот пакет, можно было без проблем сгенерировать 2 027 025 разделов для , 34 459 425 разделов для , но не 654 729 075 разделов для (на моем ноутбуке объемом 16 ГБ).k = 9 k = 10k=8k=9k=10

Пара других вещей стоит отметить. Во-первых, для гауссовых переменных с ненулевым средним должно быть возможно вывести выражение также из теоремы Иссерлиса. Во-вторых, неясно (для меня), является ли приведенная выше формула устойчивой к отклонениям от нормальности, то есть может ли она использоваться в качестве приближения, даже если переменные не являются многомерными нормально распределенными. В-третьих, хотя вышеприведенные формулы верны, сомнительно, насколько дисперсия говорит о распределении продуктов. Даже при распределение продукта является довольно лептокуртическим, а при больших оно быстро становится чрезвычайно лептокуртическим.кk=2k

NRH
источник
Аккуратный подход! Для чего это стоит, формула в моем ответе также имеет комбинаторное увеличение: суммирование по C включает суммирование членов. O(3k)
Мэтт Краузе