Почему

15

Я полагаю, что

P(A|B)=P(A|B,C)P(C)+P(A|B,¬C)P(¬C)

правильно, тогда как

P(A|B)=P(A|B,C)+P(A|B,¬C)

это неверно.

Тем не менее, у меня есть «интуиция» о последнем, то есть вы рассматриваете вероятность P (A | B), разбивая два случая (C или не C). Почему эта интуиция не так?

Zell
источник
4
Вот простой пример, чтобы проверить ваши уравнения. Бросьте две независимые, честные монеты. Пусть A будет событием, когда первый придет в голову, В будет событием, когда второе придет в голову, и С будет событием, когда оба придут в голову. Правильно ли написано уравнение?
А. Рекс
4
Закон полной вероятности говорит , что если вы хотите , чтобы выразить безусловную вероятность как сумма условных вероятностей, вы должны утяжелять случае кондиционирования: например , P(A)=P(A|B)P(B)+P(A|B¯)P(B¯)
AdamO

Ответы:

25

Предположим, в качестве простого примера счетчика, что вероятность P(A) из A является 1 , независимо от значения C . Тогда, если мы возьмем неправильное уравнение , мы получим:

P(A|B)=P(A|B,C)+P(A|B,¬C)=1+1=2

Это, очевидно, не может быть правильным, вероятно, не может быть больше 1 . Это помогает создать интуицию, согласно которой вы должны назначить вес каждому из двух случаев, пропорциональный вероятности этого случая , что приводит к первому (правильному) уравнению. ,


Это приближает вас к вашему первому уравнению, но веса не совсем верны. См. Комментарий А. Рекса для правильного веса.

Деннис Соемерс
источник
1
Должны ли веса в «первом (правильном) уравнении» быть P(C) и P(¬C) или P(CB) и P(¬CB) ?
А. Рекс
@ A.Rex Это хороший момент, для полной корректности я думаю, что это должны быть P(C|B) и P(¬C|B) . Все (только один член) в левой части уравнения предполагает, что B задано, поэтому без каких-либо дополнительных предположений (например, предположим, что B и C не зависят друг от друга), то же самое должно иметь место в правой части. со стороны
Деннис Соемерс
Только представьте, что A | B на 200% обязательно произойдет.
Марк Л. Стоун
@ MarkL.Stone Означает ли это, что это всегда происходит дважды? ;)
Восстановить Монику
9

Ответ Денниса имеет отличный контрпример, опровергающий неправильное уравнение. Этот ответ пытается объяснить, почему следующее уравнение верно:

P(A|B)=P(A|C,B)P(C|B)+P(A|¬C,B)P(¬C|B).

Поскольку каждый член обусловлен на , мы можем заменить все вероятностное пространство на B и отбросить B- член. Это дает нам:BBB

P(A)=P(A|C)P(C)+P(A|¬C)P(¬C).

Затем вы спрашиваете, почему в этом уравнении есть члены и P ( ¬ C ) .P(C)P(¬C)

Причина заключается в том, что представляет собой часть А в С и Р ( А | ¬ С ) Р ( ¬ С ) представляет собой часть А в ¬ C и два добавить до A . Смотрите схему. С другой стороны, P ( A | C ) - это доля C, содержащая A и P ( A).P(A|C)P(C)ACP(A|¬C)P(¬C)A¬CAP(A|C)CA - это доля ¬ C, содержащая A - это пропорции разных регионов, поэтому они не имеют общих знаменателей, поэтому добавлять их бессмысленно.P(A|¬C)¬CA

фильм

Восстановить Монику
источник
2
Не "все обусловлено на ". В частности, P ( C ) и P ( ¬ C ) не являются, так что вы не можете просто бросить B . Более того, это может указывать на неправильное уравнение! BP(C)P(¬C)B
А. Рекс
@ A.Rex Технически вы правы, я должен был сказать, что каждый член, включающий , обусловлен на B (я сделал простую замену A | B A ). Я исправлю ответ. ABA|BA
Восстановить Монику
5
Мои возражения не были техническими. Ваша диаграмма правильно доказывает, что , которое после кондиционирования на B становится P ( A B ) = P ( A B , C ) P ( C B )P(A)=P(AC)P(C)+P(A¬C)P(¬C)B ; заметимчто вероятности C и ¬ C также обусловлено B . Это не первое уравнение, данное в ОП, что является хорошей новостью, потому что первое уравнение, данное в ОП, неверно. P(AB)=P(AB,C)P(CB)+P(AB,¬C)P(¬CB)C¬CB
А. Рекс
@ A.Rex Вы право еще раз, должен также обусловлены B , как доля вероятностного пространства , содержащейся в C не может быть таким же , как доля B содержится в C . Эта точка ускользнула от меня. Я еще раз пересмотрю. CBCBC
Восстановить Монику
7

Я знаю, что вы уже получили два отличных ответа на свой вопрос, но я просто хотел указать, как вы можете превратить идею, лежащую в основе вашей интуиции, в правильное уравнение.

Во-первых, помните, что и, что то же самое,P(XY)=P(XY)P(Y).P(XY)=P(XY)P(Y)P(XY)=P(XY)P(Y)

Чтобы избежать ошибок, мы будем использовать первое уравнение в предыдущем абзаце, чтобы исключить все условные вероятности, затем продолжим переписывать выражения, включающие пересечения и объединения событий, а затем используем второе уравнение в предыдущем абзаце, чтобы повторно ввести условные выражения в конце , Итак, начнем с:

P(AB)=P(AB)P(B)

Мы будем переписывать правую часть, пока не получим желаемое уравнение.

Ситуация в вашей интуиции расширяет событие в ( A C ) ( A ¬ C ) , в результате чего P ( A B ) = P ( ( ( A C ) ( A ¬ C ) ) B )A(AC)(A¬C)

P(AB)=P(((AC)(A¬C))B)P(B)

Как и в случае множеств, пересечение распределяется по объединению:

P(AB)=P((ABC)(AB¬C))P(B)

Поскольку два события, объединяемые в числителе, являются взаимоисключающими (поскольку и ¬ C не могут происходить одновременно), мы можем использовать правило сумм: P ( A B ) = P ( A B C )C¬C

P(AB)=P(ABC)P(B)+P(AB¬C)P(B)

Теперь мы видим, что ; таким образом, вы можете использовать правило сумм для события в интересующем событии («левая» сторона условного бара), если вы сохраняете данное событие («правая» сторона) одинаковым. Это может быть использовано в качестве общего правила и для других доказательств равенства.P(AB)=P(ACB)+P(A¬CB)

Мы вновь ввести желаемые условными , используя второе уравнение во втором абзаце: и аналогично для ¬ C .

P(A(BC))=P(ABC)P(BC)
¬C

P(AB)

P(AB)=P(ABC)P(BC)P(B)+P(AB¬C)P(B¬C)P(B)

P(BC)P(B)=P(CB) (and similarly for ¬C), we finally get

P(AB)=P(ABC)P(CB)+P(AB¬C)P(¬CB)

Which is the correct equation (albeit with slightly different notation), including the fix A. Rex pointed out.

Note that P(ACB) turned into P(ABC)P(CB). This mirrors the equation P(AC)=P(AC)P(C) by adding the B condition to not only P(AC) and P(AC), but also P(C) as well. I think if you are to use familiar rules on conditioned probabilities, you need to add the condition to all probabilities in the rule. And if there's any doubt whether that idea works for a particular situation, you can always expand out the conditionals to check, as I did for this answer.

YawarRaza7349
источник
2
+1. I think you extracted the equation that OP tried to intuit: P(AB)=P(ACB)+P(A¬CB).
A. Rex
Thanks! That was the main point I wanted to make, but couldn't figure out a high-level explanation why the intersection goes on the left rather than the right, so I used formulas instead. Also, I just noticed you were the one who pointed out the mistake in OP's formula, so I credited you for that. (I probably wouldn't have noticed either, lol.)
YawarRaza7349
2

Probabilities are ratios; the probability of A given B is how often A happens within the space of B. For instance, P(rain|March) is the number of rainy days in March divided by the number of total days in March. When dealing with fractions, it makes sense to split up numerators. For instance,

P(rain or snow|March)=(number of rainy or snowy days in March)(total number of days in March)=(number of rainy days in March)(total number of days in March)+(number of snowy days in March)(total number of days in March)=P(rain|March)+P(snow|March)

This of course assumes that "snow" and "rain" are mutually exclusive. It does not, however, make sense to split up denominators. So if you have P(rain|February or March), that is equal to

(number of rainy days in February and March)(total number of days in February and March).

But that is not equal to

(number of rainy days in February)(total number of days in February)+(number of rainy days in March)(total number of days in March).

If you're having trouble seeing that, you can try out some numbers. Suppose there are 10 rainy days in February and 8 in March. Then we have

(number of rainy days in February and March)(total number of days in February and March)=(10+8)/(28+31)=29.5%

and

(number of rainy days in February)(total number of days in February)+(number of rainy days in March)(total number of days in March)=(10/28)+(8/31)=35.7%+25.8%=61.5%

The first number, 29.5%, is the average of 35.7% and 25.8% (with the second number weighted slightly more because there is are more days in March). When you say P(A|B)=P(A|B,C)+P(A|B,¬C) you're saying that x1+x2y1+y2=x1y1+x2y2, which is false.

Acccumulation
источник
1

Если я поеду в Испанию, я могу загореть.

п(sUNбUрNT|SпaяN)знак равно0.2
Это ничего не говорит мне о том, чтобы загореть, если не поедем в Испанию, скажем так
п(sUNбUрNT|¬SпaяN)знак равно0,1
В этом году я собираюсь в Испанию, так
P(sunburnt)=0.2
Letting B=Ω, this is, P(B)=1, your intuition would imply
P(A)=P(A|C)+P(A|¬C)
which by the previous argument, isn't neccesarily true.
sheriff
источник