Хммм ... Последний должен быть не функцией х, а числом! Я ошибаюсь?
Дэвид
Ответы:
23
Грубо говоря, разница между E ( X ∣ Y )E(X∣Y) и E ( X ∣ Y = y )E(X∣Y=y) заключается в том, что первое является случайной величиной, а второе (в некотором смысле) является реализацией E ( X ∣ Y )E(X∣Y) . Например, если ( X , Y ) ∼ N ( 0 , ( 1 ρ ρ 1 ) )
(X,Y)∼N(0,(1ρρ1))
то E ( X ∣ Y )E(X∣Y) - случайная величина
E ( X | Y ) = ρ Y .
E(X∣Y)=ρY.
Наоборот, когда Y = yY=y наблюдается, мы, скорее всего, будем интересоваться величиной E ( X ∣ Y = y ) = ρ yE(X∣Y=y)=ρy которая это скаляр
Может быть, это кажется ненужным усложнением, но если рассматривать E ( X ∣ Y )E(X∣Y) как случайную переменную само по себе, это то, что имеет смысл, например, закон башни E ( X ) = E [ E ( X ∣ Y ) ]E(X)=E[E(X∣Y)] - вещь внутри фигурных скобок является случайной, поэтому мы можем спросить, каково ее ожидание, тогда как в E нет ничего случайного (X \ mid Y = y)E ( X ∣ Y = y )E(X∣Y=y) . В большинстве случаев мы можем надеяться вычислить
E ( X ∣ Y = y ) = ∫ x f X ∣ Y ( x ∣ y ) d x
E(X∣Y=y)=∫xfX∣Y(x∣y)dx
а затем получить , "подключив" случайную переменную вместо в результирующем выражении. Как указывалось в предыдущем комментарии, есть некоторая тонкость, которая может проникнуть в суть того, как эти вещи строго определены и связать их соответствующим образом. Это обычно происходит с условной вероятностью из-за некоторых технических проблем, лежащих в основе теории.E ( X ∣ Y ) Y yE(X∣Y)Yy
Пусть - фиксированное действительное число, скажем, . Тогда,
является
число : это условное ожидаемое значение из при условии , что имеет значение . Обратите внимание, что для некоторого другого фиксированного действительного числа , скажем, , будет условным ожидаемым значением
заданным (действительным число). Нет оснований предполагать, что иy 0 y0y 0 = 1 E [ X ∣ Y = y 0 ] = E [ X ∣ Y = 1 ] X Y 1 y 1 y 1 = 1,5 E [ X ∣ Y = y 1 ] = E [ X ∣ Y = 1,5 ] X Y = 1,5 E [ X ∣ Y =y0=1E[X∣Y=y0]=E[X∣Y=1]XY1y1y1=1.5E[X∣Y=y1]=E[X∣Y=1.5]XY=1.51.5 ] E[X∣Y=1.5]E [ X ∣ Y = 1 ] E[X∣Y=1]имеют одинаковое значение. Таким образом, мы также можем рассматривать как действительную функцию
которая отображает действительные числа в действительные числа . Обратите внимание, что утверждение в вопросе OP о том, что является функцией от
, неверно: является действительной функцией от .E [ X ∣ Y = y ] E[X∣Y=y]g ( y ) y E [ X ∣ Y = y ] E [ X ∣ Y = y ] x E [ X ∣ Y = y ] yg(y)yE[X∣Y=y]E[X∣Y=y]xE[X∣Y=y]y
С другой стороны, , является случайной величиной , которое случается быть функцией случайной величины . Теперь, когда мы пишем , мы имеем в виду, что всякий раз, когда случайная переменная
имеет значение , случайная переменная имеет значение
. Всякий раз, когда принимает значение , случайная величина принимает значение . Таким образом, - это просто другое имя для случайной величиныE [ X ∣ Y ] E[X∣Y]Z Y Z = h ( Y ) Y y Z h ( y ) Y y Z = E [ X ∣ Y ] E [ X ∣ Y = y ] = g ( y ) E [ X ∣ Y ] Z = g ( Y ) E [ X ∣ YZYZ=h(Y)YyZh(y)YyZ=E[X∣Y]E[X∣Y=y]=g(y)E[X∣Y]Z=g(Y), Обратите внимание, что является функцией
(а не как в формулировке вопроса ОП).] E[X∣Y]Y Yyy
В качестве простого иллюстративного примера предположим, что
и представляют собой дискретные случайные величины с совместным распределением
Обратите внимание, что и являются (зависимыми) случайными величинами Бернулли с параметрами и соответственно, поэтому
и . Теперь, обратите внимание , что кондиционер на , является случайной величиной Бернулли с параметром , а с кондиционеромX XY YP ( X = 0 , Y = 0 )= 0,1 , P ( X = 0 , Y = 1 ) = 0,2 , P ( X = 1 , Y = 0 )= 0,3 , P ( X = 1 , Y = 1 ) = 0,4.
XXYY0.70.70.60.6E[X]=0.7E[X]=0.7E[Y]=0.6E[Y]=0.6Y=0Y=0XX0.750.75на , представляет собой случайную величину Бернулли с параметром . Если вы не можете понять, почему это происходит так быстро, просто проработайте детали: например,
и аналогично для и . Следовательно, у нас есть
Таким образом, где - вещественная функция, обладающая свойствами:Y=1Y=1XX2323P(X=1∣Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0∣Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14,
С другой стороны, является случайной величиной,
которая принимает значения и с вероятностями и соответственно. Обратите внимание, что является дискретной случайной величиной, но не является случайной величиной Бернулли.E[X∣Y]=g(Y)E[X∣Y]=g(Y)343423230.4=P(Y=0)0.4=P(Y=0)0.6=P(Y=1)0.6=P(Y=1)E[X∣Y]E[X∣Y]
Как последний штрих, обратите внимание, что
То есть, ожидаемое значение этой функции из , который мы рассчитали , используя только маргинальное распределение , случается , чтобы иметь такое же численное значение , как !! Это иллюстрация более общего результата, который многие люди считают ЛЖИ:
E[Z]=E[E[X∣Y]]=E[g(Y)]=0.4×34+0.6×23=0.7=E[X].
E[Z]=E[E[X∣Y]]=E[g(Y)]=0.4×34+0.6×23=0.7=E[X].
YYYYE[X]E[X]E[E[X∣Y]]=E[X].
E[E[X∣Y]]=E[X].
Извините, это всего лишь маленькая шутка. LIE - это аббревиатура Закона повторяющихся ожиданий, который является совершенно достоверным результатом, который, как все считают, является правдой.
E(X|Y)E(X|Y) является ожидание случайной величины: математическое ожидание обусловливающих .
, с другой стороны, является конкретным значением: ожидаемое значение когда .XXYYE(X|Y=y)E(X|Y=y)XXY=yY=y
Подумайте об этом так: пусть представляет потребление калорий, а представляет рост. - это потребление калорий, обусловленное ростом - и в этом случае представляет собой наше лучшее предположение о потреблении калорий ( ), когда человек имеет определенную высоту скажем, 180 сантиметров. XXYYE(X|Y)E(X|Y)E(X|Y=y)E(X|Y=y)XXY=yY=y
Я считаю, что ваше первое предложение должно заменить «распределение» на «ожидание» (дважды).
Glen_b
4
E(X∣Y)E(X∣Y) не является распределением учетом ; это будет чаще обозначаться условной плотностью или функцией условного распределения. - условное ожидание заданное , которое является измеримой случайной величиной. можно рассматривать как реализацию случайной величины когда наблюдается (но существует возможность проникновения в теоретико-мерную тонкость). XXYYfX∣Y(x∣y)fX∣Y(x∣y)E(X∣Y)E(X∣Y)XXYYE(X∣Y=y)E(X∣Y)Y=y
парень
1
@guy Ваше объяснение является первым точным ответом, который был предоставлен (из трех предложенных до сих пор). Считаете ли вы разместить его в качестве ответа?
whuber
@whuber Я бы хотел, но я не уверен, как найти баланс между точностью и подходящим ответом для ОП, и я параноидально отношусь к техническим сложностям :)
парень,
@ Гай, я думаю, вы уже хорошо поработали с техническими вопросами. Поскольку вы хорошо относитесь к общению с OP (что здорово!), Подумайте над предложением простого примера для иллюстрации - возможно, просто совместного распределения с двоичными маргиналами.
whuber
1
E(X|Y) - ожидаемое значение значений учетом значений - ожидаемое значение учетом значений -XYE(X|Y=y)XYy
Обычно - это вероятность значений данными значениями , но вы можете получить более точное значение и сказать , то есть вероятность значения из всех значений , заданных для 'th значение 's. Разница в том, что в первом случае речь идет о «значениях», а во втором вы рассматриваете определенное значение.P(X|Y)XYP(X=x|Y=y)xXyY
Ответы:
Грубо говоря, разница между E ( X ∣ Y )E(X∣Y) и E ( X ∣ Y = y )E(X∣Y=y) заключается в том, что первое является случайной величиной, а второе (в некотором смысле) является реализацией E ( X ∣ Y )E(X∣Y) . Например, если ( X , Y ) ∼ N ( 0 , ( 1 ρ ρ 1 ) )
Может быть, это кажется ненужным усложнением, но если рассматривать E ( X ∣ Y )E(X∣Y) как случайную переменную само по себе, это то, что имеет смысл, например, закон башни E ( X ) = E [ E ( X ∣ Y ) ]E(X)=E[E(X∣Y)] - вещь внутри фигурных скобок является случайной, поэтому мы можем спросить, каково ее ожидание, тогда как в E нет ничего случайного (X \ mid Y = y)E ( X ∣ Y = y )E(X∣Y=y) . В большинстве случаев мы можем надеяться вычислить
E ( X ∣ Y = y ) = ∫ x f X ∣ Y ( x ∣ y ) d x
а затем получить , "подключив" случайную переменную вместо в результирующем выражении. Как указывалось в предыдущем комментарии, есть некоторая тонкость, которая может проникнуть в суть того, как эти вещи строго определены и связать их соответствующим образом. Это обычно происходит с условной вероятностью из-за некоторых технических проблем, лежащих в основе теории.E ( X ∣ Y ) Y yE(X∣Y) Y y
источник
Предположим, что и - случайные величины.XX YY
Пусть - фиксированное действительное число, скажем, . Тогда, является число : это условное ожидаемое значение из при условии , что имеет значение . Обратите внимание, что для некоторого другого фиксированного действительного числа , скажем, , будет условным ожидаемым значением заданным (действительным число). Нет оснований предполагать, что иy 0y0 y 0 = 1 E [ X ∣ Y = y 0 ] = E [ X ∣ Y = 1 ] X Y 1 y 1 y 1 = 1,5 E [ X ∣ Y = y 1 ] = E [ X ∣ Y = 1,5 ] X Y = 1,5 E [ X ∣ Y =y0=1 E[X∣Y=y0]=E[X∣Y=1] X Y 1 y1 y1=1.5 E[X∣Y=y1]=E[X∣Y=1.5] X Y=1.5 1.5 ] E[X∣Y=1.5] E [ X ∣ Y = 1 ] E[X∣Y=1] имеют одинаковое значение. Таким образом, мы также можем рассматривать как действительную функцию
которая отображает действительные числа в действительные числа . Обратите внимание, что утверждение в вопросе OP о том, что является функцией от
, неверно: является действительной функцией от .E [ X ∣ Y = y ] E[X∣Y=y] g ( y ) y E [ X ∣ Y = y ] E [ X ∣ Y = y ] x E [ X ∣ Y = y ] y g(y) y E[X∣Y=y] E[X∣Y=y] x E[X∣Y=y] y
С другой стороны, , является случайной величиной , которое случается быть функцией случайной величины . Теперь, когда мы пишем , мы имеем в виду, что всякий раз, когда случайная переменная имеет значение , случайная переменная имеет значение . Всякий раз, когда принимает значение , случайная величина принимает значение . Таким образом, - это просто другое имя для случайной величиныE [ X ∣ Y ]E[X∣Y] Z Y Z = h ( Y ) Y y Z h ( y ) Y y Z = E [ X ∣ Y ] E [ X ∣ Y = y ] = g ( y ) E [ X ∣ Y ] Z = g ( Y ) E [ X ∣ Y Z Y Z=h(Y) Y y Z h(y) Y y
Z=E[X∣Y] E[X∣Y=y]=g(y) E[X∣Y] Z=g(Y) , Обратите внимание, что является функцией
(а не как в формулировке вопроса ОП).] E[X∣Y] Y Y yy
В качестве простого иллюстративного примера предположим, что и представляют собой дискретные случайные величины с совместным распределением Обратите внимание, что и являются (зависимыми) случайными величинами Бернулли с параметрами и соответственно, поэтому и . Теперь, обратите внимание , что кондиционер на , является случайной величиной Бернулли с параметром , а с кондиционеромXX Y Y P ( X = 0 , Y = 0 )= 0,1 , P ( X = 0 , Y = 1 ) = 0,2 , P ( X = 1 , Y = 0 )= 0,3 , P ( X = 1 , Y = 1 ) = 0,4. P(X=0,Y=0)P(X=1,Y=0)=0.1, P(X=0,Y=1)=0.2,=0.3, P(X=1,Y=1)=0.4. XX YY 0.70.7 0.60.6 E[X]=0.7E[X]=0.7 E[Y]=0.6E[Y]=0.6 Y=0Y=0 XX 0.750.75 на , представляет собой случайную величину Бернулли с параметром . Если вы не можете понять, почему это происходит так быстро, просто проработайте детали: например,
и аналогично для и . Следовательно, у нас есть
Таким образом, где - вещественная функция, обладающая свойствами:Y=1Y=1 XX 2323 P(X=1∣Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0∣Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14,P(X=1∣Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0∣Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14, P(X=1∣Y=1)P(X=1∣Y=1) P(X=0∣Y=1)P(X=0∣Y=1) E[X∣Y=0]=34,E[X∣Y=1]=23.E[X∣Y=0]=34,E[X∣Y=1]=23. E[X∣Y=y]=g(y)E[X∣Y=y]=g(y) g(y)g(y) g(0)=34,g(1)=23.g(0)=34,g(1)=23.
С другой стороны, является случайной величиной, которая принимает значения и с вероятностями и соответственно. Обратите внимание, что является дискретной случайной величиной, но не является случайной величиной Бернулли.E[X∣Y]=g(Y)E[X∣Y]=g(Y) 3434 2323 0.4=P(Y=0)0.4=P(Y=0) 0.6=P(Y=1)0.6=P(Y=1) E[X∣Y]E[X∣Y]
Как последний штрих, обратите внимание, что То есть, ожидаемое значение этой функции из , который мы рассчитали , используя только маргинальное распределение , случается , чтобы иметь такое же численное значение , как !! Это иллюстрация более общего результата, который многие люди считают ЛЖИ: E[Z]=E[E[X∣Y]]=E[g(Y)]=0.4×34+0.6×23=0.7=E[X].E[Z]=E[E[X∣Y]]=E[g(Y)]=0.4×34+0.6×23=0.7=E[X]. YY YY E[X]E[X] E[E[X∣Y]]=E[X].E[E[X∣Y]]=E[X].
Извините, это всего лишь маленькая шутка. LIE - это аббревиатура Закона повторяющихся ожиданий, который является совершенно достоверным результатом, который, как все считают, является правдой.
источник
E(X|Y)E(X|Y) является ожидание случайной величины: математическое ожидание обусловливающих .
, с другой стороны, является конкретным значением: ожидаемое значение когда .XX YY E(X|Y=y)E(X|Y=y) XX Y=yY=y
Подумайте об этом так: пусть представляет потребление калорий, а представляет рост. - это потребление калорий, обусловленное ростом - и в этом случае представляет собой наше лучшее предположение о потреблении калорий ( ), когда человек имеет определенную высоту скажем, 180 сантиметров. XX YY E(X|Y)E(X|Y) E(X|Y=y)E(X|Y=y) XX Y=yY=y
источник
E(X|Y) - ожидаемое значение значений учетом значений - ожидаемое значение учетом значений -XY E(X|Y=y)XYy
Обычно - это вероятность значений данными значениями , но вы можете получить более точное значение и сказать , то есть вероятность значения из всех значений , заданных для 'th значение 's. Разница в том, что в первом случае речь идет о «значениях», а во втором вы рассматриваете определенное значение.P(X|Y)XYP(X=x|Y=y)xXyY
Вы можете найти диаграмму ниже полезной.
источник