В чем разница между и ?

18

Какова разница между и ?E ( X | Y ) E(X|Y)E ( X | Y = y )E(X|Y=y)

Раньше функция Yy а последняя функция Иксx ? Это так запутанно ..

신범준
источник
Хммм ... Последний должен быть не функцией х, а числом! Я ошибаюсь?
Дэвид

Ответы:

23

Грубо говоря, разница между E ( X Y )E(XY) и E ( X Y = y )E(XY=y) заключается в том, что первое является случайной величиной, а второе (в некотором смысле) является реализацией E ( X Y )E(XY) . Например, если ( X , Y ) N ( 0 , ( 1 ρ ρ 1 ) )

(X,Y)N(0,(1ρρ1))
то E ( X Y )E(XY) - случайная величина E ( X | Y ) = ρ Y .
E(XY)=ρY.
Наоборот, когда Y = yY=y наблюдается, мы, скорее всего, будем интересоваться величиной E ( X Y = y ) = ρ yE(XY=y)=ρy которая это скаляр

Может быть, это кажется ненужным усложнением, но если рассматривать E ( X Y )E(XY) как случайную переменную само по себе, это то, что имеет смысл, например, закон башни E ( X ) = E [ E ( X Y ) ]E(X)=E[E(XY)] - вещь внутри фигурных скобок является случайной, поэтому мы можем спросить, каково ее ожидание, тогда как в E нет ничего случайного (X \ mid Y = y)E ( X Y = y )E(XY=y) . В большинстве случаев мы можем надеяться вычислить E ( X Y = y ) = x f X Y ( x y ) d x 

E(XY=y)=xfXY(xy) dx

а затем получить , "подключив" случайную переменную вместо в результирующем выражении. Как указывалось в предыдущем комментарии, есть некоторая тонкость, которая может проникнуть в суть того, как эти вещи строго определены и связать их соответствующим образом. Это обычно происходит с условной вероятностью из-за некоторых технических проблем, лежащих в основе теории.E ( X Y ) Y yE(XY)Yy

парень
источник
8

Предположим, что и - случайные величины.X XYY

Пусть - фиксированное действительное число, скажем, . Тогда, является число : это условное ожидаемое значение из при условии , что имеет значение . Обратите внимание, что для некоторого другого фиксированного действительного числа , скажем, , будет условным ожидаемым значением заданным (действительным число). Нет оснований предполагать, что иy 0 y0y 0 = 1 E [ X Y = y 0 ] = E [ X Y = 1 ] X Y 1 y 1 y 1 = 1,5 E [ X Y = y 1 ] = E [ X Y = 1,5 ] X Y = 1,5 E [ X Y =y0=1E[XY=y0]=E[XY=1]XY1y1y1=1.5E[XY=y1]=E[XY=1.5]XY=1.51.5 ] E[XY=1.5]E [ X Y = 1 ] E[XY=1]имеют одинаковое значение. Таким образом, мы также можем рассматривать как действительную функцию которая отображает действительные числа в действительные числа . Обратите внимание, что утверждение в вопросе OP о том, что является функцией от , неверно: является действительной функцией от .E [ X Y = y ] E[XY=y]g ( y ) y E [ X Y = y ] E [ X Y = y ] x E [ X Y = y ] y g(y)yE[XY=y]E[XY=y]xE[XY=y]y

С другой стороны, , является случайной величиной , которое случается быть функцией случайной величины . Теперь, когда мы пишем , мы имеем в виду, что всякий раз, когда случайная переменная имеет значение , случайная переменная имеет значение . Всякий раз, когда принимает значение , случайная величина принимает значение . Таким образом, - это просто другое имя для случайной величиныE [ X Y ] E[XY]Z Y Z = h ( Y ) Y y Z h ( y ) Y y Z = E [ X Y ] E [ X Y = y ] = g ( y ) E [ X Y ] Z = g ( Y ) E [ X Y ZYZ=h(Y)YyZh(y)Yy Z=E[XY]E[XY=y]=g(y)E[XY]Z=g(Y), Обратите внимание, что является функцией (а не как в формулировке вопроса ОП).] E[XY]Y Yyy

В качестве простого иллюстративного примера предположим, что и представляют собой дискретные случайные величины с совместным распределением Обратите внимание, что и являются (зависимыми) случайными величинами Бернулли с параметрами и соответственно, поэтому и . Теперь, обратите внимание , что кондиционер на , является случайной величиной Бернулли с параметром , а с кондиционеромX XY YP ( X = 0 , Y = 0 )= 0,1 , P ( X = 0 , Y = 1 ) = 0,2 ,   P ( X = 1 , Y = 0 )= 0,3 , P ( X = 1 , Y = 1 ) = 0,4.   

P(X=0,Y=0)P(X=1,Y=0)=0.1,  P(X=0,Y=1)=0.2,=0.3,  P(X=1,Y=1)=0.4.
XXYY0.70.70.60.6E[X]=0.7E[X]=0.7E[Y]=0.6E[Y]=0.6Y=0Y=0XX0.750.75на , представляет собой случайную величину Бернулли с параметром . Если вы не можете понять, почему это происходит так быстро, просто проработайте детали: например, и аналогично для и . Следовательно, у нас есть Таким образом, где - вещественная функция, обладающая свойствами:Y=1Y=1XX2323P(X=1Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14,
P(X=1Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14,
P(X=1Y=1)P(X=1Y=1)P(X=0Y=1)P(X=0Y=1)E[XY=0]=34,E[XY=1]=23.
E[XY=0]=34,E[XY=1]=23.
E[XY=y]=g(y)E[XY=y]=g(y)g(y)g(y)g(0)=34,g(1)=23.
g(0)=34,g(1)=23.

С другой стороны, является случайной величиной, которая принимает значения и с вероятностями и соответственно. Обратите внимание, что является дискретной случайной величиной, но не является случайной величиной Бернулли.E[XY]=g(Y)E[XY]=g(Y)343423230.4=P(Y=0)0.4=P(Y=0)0.6=P(Y=1)0.6=P(Y=1)E[XY]E[XY]

Как последний штрих, обратите внимание, что То есть, ожидаемое значение этой функции из , который мы рассчитали , используя только маргинальное распределение , случается , чтобы иметь такое же численное значение , как !! Это иллюстрация более общего результата, который многие люди считают ЛЖИ: E[Z]=E[E[XY]]=E[g(Y)]=0.4×34+0.6×23=0.7=E[X].

E[Z]=E[E[XY]]=E[g(Y)]=0.4×34+0.6×23=0.7=E[X].
YYYYE[X]E[X]E[E[XY]]=E[X].
E[E[XY]]=E[X].

Извините, это всего лишь маленькая шутка. LIE - это аббревиатура Закона повторяющихся ожиданий, который является совершенно достоверным результатом, который, как все считают, является правдой.

Дилип Сарватэ
источник
3

E(X|Y)E(X|Y) является ожидание случайной величины: математическое ожидание обусловливающих . , с другой стороны, является конкретным значением: ожидаемое значение когда .XXYYE(X|Y=y)E(X|Y=y)XXY=yY=y

Подумайте об этом так: пусть представляет потребление калорий, а представляет рост. - это потребление калорий, обусловленное ростом - и в этом случае представляет собой наше лучшее предположение о потреблении калорий ( ), когда человек имеет определенную высоту скажем, 180 сантиметров. XXYYE(X|Y)E(X|Y)E(X|Y=y)E(X|Y=y)XXY=yY=y

abaumann
источник
4
Я считаю, что ваше первое предложение должно заменить «распределение» на «ожидание» (дважды).
Glen_b
4
E(XY)E(XY) не является распределением учетом ; это будет чаще обозначаться условной плотностью или функцией условного распределения. - условное ожидание заданное , которое является измеримой случайной величиной. можно рассматривать как реализацию случайной величины когда наблюдается (но существует возможность проникновения в теоретико-мерную тонкость). XXYYfXY(xy)fXY(xy)E(XY)E(XY)XXYYE(XY=y)E(XY)Y=y
парень
1
@guy Ваше объяснение является первым точным ответом, который был предоставлен (из трех предложенных до сих пор). Считаете ли вы разместить его в качестве ответа?
whuber
@whuber Я бы хотел, но я не уверен, как найти баланс между точностью и подходящим ответом для ОП, и я параноидально отношусь к техническим сложностям :)
парень,
@ Гай, я думаю, вы уже хорошо поработали с техническими вопросами. Поскольку вы хорошо относитесь к общению с OP (что здорово!), Подумайте над предложением простого примера для иллюстрации - возможно, просто совместного распределения с двоичными маргиналами.
whuber
1

E(X|Y) - ожидаемое значение значений учетом значений - ожидаемое значение учетом значений -XY E(X|Y=y)XYy

Обычно - это вероятность значений данными значениями , но вы можете получить более точное значение и сказать , то есть вероятность значения из всех значений , заданных для 'th значение 's. Разница в том, что в первом случае речь идет о «значениях», а во втором вы рассматриваете определенное значение.P(X|Y)XYP(X=x|Y=y)xXyY

Вы можете найти диаграмму ниже полезной.

Теорема Байеса в виде диаграммы Википедии

Тим
источник
В этом ответе обсуждается вероятность, а вопрос - об ожидании. Какая связь?
whuber