Как определяется когда

11

Скажем, что Y - непрерывная случайная величина, а X - дискретная.

Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)

Как мы знаем, Pr(Y=y)=0 потому что Y - непрерывная случайная величина. И на основании этого я испытываю желание сделать вывод, что вероятность Pr(X=x|Y=y) не определена.

Тем не менее, Википедия утверждает здесь, что она на самом деле определяется следующим образом:

Pr(X=x|Y=y)=Pr(X=x)fY|X=x(y)fY(y)

Вопрос: Есть идеи, как Википедии удалось определить эту вероятность?


Моя попытка

Вот моя попытка получить этот результат Википедии с точки зрения ограничений:

Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)=limd0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=limd0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=Pr(X=x)fY|X=x(y)fY(y)

Теперь Pr(X=x|Y=y) , по-видимому, определяется как Pr(X=x)fY|X=x(y)fY(y) , что соответствует эта претензия в Википедии.

Это то, как Википедия это сделала?

Но я все еще чувствую, что я злоупотребляю исчислением здесь. Поэтому я думаю, что Pr(X=x|Y=y) не определено, но в максимально возможной степени мы можем определить Pr(Y=y) и Pr(Y=y|X=x) , но не сразу, тогда Pr(X=x|Y=y) определено.

Но я в значительной степени не уверен во многих вещах, в том числе в уловке пределов, которую я там сделал, я чувствую, что, возможно, я даже не до конца понимаю смысл того, что я сделал.

троглодит
источник
1
Действительно, Pr (X = x) = 0, но плотность X в xf (x) может быть не равна 0. Разве вы не должны использовать ярлык «самообучение» ??
Lil'Lobster
2
@Lil Насколько я знаю, тег «самообучения» предназначен для решения домашних заданий. Я этого не делаю.
пещерный человек
1
Страница Википедии фактически ссылается на происхождение: en.wikipedia.org/wiki/Bayes'_theorem#Derivation
Ицен де Бур
3
Боюсь, ваш вывод не имеет математического обоснования, так как для всех когда непрерывен. P(Y=y)=0yYY
Сиань

Ответы:

10

Условное распределение вероятностей , , , формально определяется как решение уравнения , где обозначает - алгебра , связанная с распределением . Одно из этих решений обеспечивается формулой Байеса (1763), как указано в Википедии :P(X=x|Y=y)xXyY

P(X=x,YA)=AP(X=x|Y=y)fY(y)dyAσ(Y)
σ(Y)σY
P(X=x|Y=y)=P(X=x)fY|X=x(y)fY(y)xX, yY
хотя версии, которые произвольно определены для набора ноль мер в , также допустимы.σ(Y)

Понятие условной вероятности относительно изолированной гипотезы, вероятность которой равна 0, недопустимо. Ибо мы можем получить распределение вероятности для [широты] на меридианной окружности только в том случае, если рассматривать эту окружность как элемент разложения всей сферической поверхности на меридианные окружности с заданными полюсами -  Андрей Колмогоров

Как показывает парадокс Бореля-Колмогорова , при заданном значении потенциально взятом , условное распределение вероятностей не имеет точного значения не только потому, что событие имеет нулевую меру, но также потому, что это событие можно интерпретировать как измеримое по бесконечному диапазону -алгебр.y0YP(X=x|Y=y0){ω;Y(ω)=y0}σ

Примечание: вот еще более формальное введение, взятое из обзора теории вероятностей в блоге Терри Тао :

Определение 9 (дезинтеграции) Пусть является случайной величиной с расстояния . Дезинтеграции от лежащей в основе выборочного пространства относительно представляет собой подмножество из полной меры в (таким образом почти наверняка) вместе с присвоением вероятностной меры на подпространстве of для каждого , который измерим в том смысле, что отображениеYR(R,(μy)yR)ΩYRRμYYRP(|Y=y)Ωy:={ωΩ:Y(ω)=y}ΩyRyP(F|Y=y)измеримо для каждого события и такого, что для всех таких событий, где (почти наверняка определенная) случайная величина, определенная равной всякий раз, когда .F

P(F)=EP(F|Y)
P(F|Y)P(F|Y=y)Y=y

При таком распаде мы можем затем обусловить событие для любого , заменив подпространством (с индуцированной -algebra), но заменив основную меру вероятности с . Таким образом, мы можем обусловить (безусловные) события и случайные величины этим событием, чтобы создать условные события и случайные величины в условном пространстве, что приводит к условным вероятностямY=yyRΩΩyσPP(|Y=y)FX(F|Y=y)(X|Y=y)P(F|Y=y)(что согласуется с существующими обозначениями этого выражения) и условными ожиданиями (при условии абсолютной интегрируемости в этом условном пространстве). Затем мы устанавливаем как (почти наверняка определенную) случайную величину, определенную равной всякий раз, когда .E(X|Y=y)E(X|Y)E(X|Y=y)Y=y

Сиань
источник
1
Уже +1, но ... может быть, это придирки, но не будет ли более точным ссылаться на теорему Байеса как формулу Байеса / Лапласа ..?
Тим
2
@Tim: спасибо, но я не хочу звучать слишком шовинистично! И это факт, что формула Байеса для дискретных (биномиальных) и непрерывных (бета) появляется в статье Байеса (1763). Конечно, Лаплас поставил результат в гораздо более широком смысле. XY
Сиань
4

Я дам эскиз того, как части могут совмещаться, когда непрерывно, а дискретно.YX

Плотность смешанного соединения:

fXY(x,y)

Предельная плотность и вероятность:

fY(y)=xXfXY(x,y)

P(X=x)=fXY(x,y)dy

Условная плотность и вероятность:

fYX(yX=x)=fXY(x,y)P(X=x)

P(X=xY=y)=fXY(x,y)fY(y)

Правило Байеса:

fYX(yX=x)=P(X=xY=y)fY(y)P(X=x)

P(X=xY=y)=fYX(yX=x)P(X=x)fY(y)

Конечно, современный строгий способ борьбы с вероятностью - это теория меры. Для точного определения см. Ответ Сианя.

Мэтью Ганн
источник
2

Обратите внимание, что статья в Википедии фактически использует следующее определение: то есть трактует результат как плотность, а не как вероятность, как у вас есть. Поэтому я бы сказал, что вы правы, что не определено, когда непрерывен, а дискретен, поэтому вместо этого мы рассматриваем только плотности вероятностей над в этом случае.

fX(x|Y=y)=P(Y=y|X=x)fX(x)p(Y=y)
P(X=x|Y=y)XYX

Редактировать: Из-за путаницы с нотацией (см. Комментарии) вышеизложенное относится к противоположной ситуации, о которой спрашивал пещерный человек.

Рубен ван Берген
источник