Соотношение вероятностей и соотношение PDF-файлов

12

Я использую Байес для решения проблемы кластеризации. После выполнения некоторых вычислений у меня возникает необходимость получить соотношение двух вероятностей:

P(A)/P(B)

чтобы иметь возможность получить . Эти вероятности получены путем интегрирования двух разных 2D многомерных KDE, как объяснено в этом ответе :P(H|D)

P ( B ) = х Руководство , Y : G ( X , Y ) < г ( R B , сек б ) г ( х , у )

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

где F ( х , у ) и г ( х , у ) являются KDEs и интегрирование выполняется для всех точек ниже пороговых значений F ( г , ев а ) и г ( г Ь , ь б ) . Оба KDE используют гауссово ядро . Репрезентативное изображение KDE, похожее на то, с которым я работаю, можно увидеть здесь: Интеграция оценки плотности ядра в 2D .f^(x,y)g^(x,y)f^(ra,sa)g^(rb,sb)

Я вычисляю KDE с помощью pythonфункции stats.gaussian_kde , поэтому я принимаю следующую общую форму:

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

где nдлина моего массива точек и hиспользуемая пропускная способность.

Вышеуказанные интегралы рассчитываются с использованием процесса Монте-Карло, который довольно затратен в вычислительном отношении. Я где-то читал (забыл, где, извините), что в подобных случаях можно заменить отношение вероятностей на соотношение PDF-файлов (KDE), оцененных в пороговых точках, чтобы получить одинаково достоверные результаты. Я заинтересован в этом, потому что вычисление отношения KDEs на несколько порядков быстрее, чем вычисление отношения интегралов с MC.

Таким образом, вопрос сводится к действительности этого выражения:

P(A)P(B)=f^(ra,sa)g^(rb,sb)

При каких обстоятельствах, если таковые имеются, могу ли я сказать, что это соотношение верно?

[исправлена ​​опечатка (EDIT)]


Добавить :

Вот в основном тот же вопрос, но в более математической форме.

Габриель
источник
1
ra,b,sa,b
1
Я считаю, что соотношение Миллса может быть актуальным.
whuber
@whuber это соотношение, по-видимому, требует, чтобы я знал значение, P(X)которое я стараюсь избегать. Не могли бы вы немного рассказать об актуальности этого параметра?
Габриэль

Ответы:

3

KDE представляет собой смесь нормальных распределений. Давайте посмотрим на один из них.

P(A)P(B)f

f(x,y)f(r,s)

эквивалентно

x2+y2r2+s2.

ρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

Теперь рассмотрим смесь. Потому что это линейно,

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

fP2πh2


Pff1A1f2A2A1μ>1f=f1/2+f2/21/2A11/(2μ)A2

  1. (r,s)A1f(r,s)=1/2P(r,s)=1f(r,s)/P(r,s)=1/2

  2. (r,s)A2f(r,s)1/20A11/2f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. fP

11/μ1(0,Σ)Σf/P[1,1/μ]


PfPχ2(2)fP должен быть пропорциональным.

Whuber
источник
Это невероятный ответ, спасибо большое. Мне потребуется некоторое время, чтобы полностью обработать все, что вы написали здесь, но я полностью доверяю вам вычислениям, что означает, что я пометил вопрос как решенный. Приветствия.
Габриэль