Я пытался развить интуитивное понимание теоремы Байеса с точки зрения априорной , апостериорной , вероятностной и предельной вероятности. Для этого я использую следующее уравнение: где представляет гипотезу или убеждение, а представляет данные или свидетельство. Я понял концепцию апостериор - это объединяющая сущность, которая сочетает в себе предшествующее убеждение и вероятность события. То, что я не понимаю, что означает вероятность ? И почему маргинальный AB
вероятность в знаменателе?
Изучив пару ресурсов, я наткнулся на эту цитату:
Вероятность является вес события определяется возникновением ... является задней вероятностью события , при условии , что событие произошло.
Вышеприведенные 2 утверждения кажутся мне идентичными, просто написаны по-разному. Может кто-нибудь объяснить, пожалуйста, разницу между ними?
источник
Ответы:
Хотя в законе Байеса перечислены четыре компонента, я предпочитаю думать в терминах трех концептуальных компонентов:
источник
Уже есть несколько хороших ответов, но, возможно, это может добавить что-то новое ...
Я всегда думаю о байесовском правиле с точки зрения вероятностей компонентов, которые можно понимать геометрически с точки зрения событий и как показано ниже.BA B
Предельная вероятность и задаются площадей соответствующих кругов. Все возможные результаты представлены как , что соответствует набору событий « или ». В совместных вероятностей соответствует событию « и ».P ( B ) P ( A ∪ B ) = 1 A B P ( A ∩ B ) A BP(A) P(B) P(A∪B)=1 A B P(A∩B) A B
В этом контексте условные вероятности в теореме Байеса можно понимать как отношения площадей. Вероятность данного - это доля занятая , выраженная как Аналогично, вероятность заданная - это доля занятая , то есть B B A ∩ B P ( A | B ) = P ( A ∩ B )A B B A∩B
Теорема Байеса на самом деле является лишь математическим следствием приведенных выше определений, которые можно переформулировать как I найти эту симметричную форму теоремы Байеса гораздо легче запомнить. То есть идентичность сохраняется независимо от того, какой или помечен как «предыдущий» или «задний».p ( A ) p ( B )
(Другой способ понимания приведенного выше обсуждения дан в моем ответе на этот вопрос с точки зрения «бухгалтерской таблицы».)
источник
У @gung отличный ответ. Я хотел бы добавить один пример, чтобы объяснить «инициацию» в реальном примере.
Для лучшей связи с примерами из реального мира я хотел бы изменить обозначение, где использовать чтобы представить гипотезу ( A в вашем уравнении), и использовать E, чтобы представить доказательства. ( B в вашем уравнении.)H A E B
Таким образом, формула
Обратите внимание, что та же формула может быть записана как
где означает пропорциональность, а P ( E | H ) - вероятность, а P ( H ) - приоритет . Это уравнение означает, что апостериор будет больше, если правая часть уравнения больше. И вы можете думать, что P ( E ) - это нормализационная константа, чтобы превратить число в вероятность (причина, по которой я говорю, что это константа, в том, что доказательство E уже дано).∝ P(E|H) P(H) P(E) E
Для примера из реальной жизни, предположим, что мы делаем какое-то обнаружение мошенничества при транзакциях по кредитным картам. Тогда гипотезой будет где представленная транзакция является нормальной или мошеннической. (Я выбрал крайне несбалансированный случай, чтобы показать интуицию).H∈{0,1}
Из знаний предметной области мы знаем, что большинство транзакций было бы нормальным, только очень немногие являются мошенничеством. Допустим, эксперт сказал нам, что из 1000 будет мошенничеством. Таким образом , мы можем сказать , что до является Р ( Н = 1 ) = 0,001 и Р ( Н = 0 ) = 0,999 .1 1000 P(H=1)=0.001 P(H=0)=0.999
источник
Обратите внимание, что правило Байеса
Обратите внимание на соотношение
Интересно, что журнал этого соотношения также присутствует во взаимной информации:
источник
правдоподобие = пропорции строк сзади = пропорции столбцов
Приоритет и маргинал определяются аналогично, но основаны на «итогах» вместо определенного столбца.
маргинальный = общие пропорции строки предыдущий = общие пропорции столбца
Я считаю, что это помогает мне.
источник