Я использую Байес для решения проблемы кластеризации. После выполнения некоторых вычислений у меня возникает необходимость получить соотношение двух вероятностей:
чтобы иметь возможность получить . Эти вероятности получены путем интегрирования двух разных 2D многомерных KDE, как объяснено в этом ответе :
P ( B ) = ∬ х Руководство , Y : G ( X , Y ) < г ( R B , сек б ) г ( х , у )
где F ( х , у ) и г ( х , у ) являются KDEs и интегрирование выполняется для всех точек ниже пороговых значений F ( г , ев а ) и г ( г Ь , ь б ) . Оба KDE используют гауссово ядро . Репрезентативное изображение KDE, похожее на то, с которым я работаю, можно увидеть здесь: Интеграция оценки плотности ядра в 2D .
Я вычисляю KDE с помощью python
функции stats.gaussian_kde , поэтому я принимаю следующую общую форму:
где n
длина моего массива точек и h
используемая пропускная способность.
Вышеуказанные интегралы рассчитываются с использованием процесса Монте-Карло, который довольно затратен в вычислительном отношении. Я где-то читал (забыл, где, извините), что в подобных случаях можно заменить отношение вероятностей на соотношение PDF-файлов (KDE), оцененных в пороговых точках, чтобы получить одинаково достоверные результаты. Я заинтересован в этом, потому что вычисление отношения KDEs на несколько порядков быстрее, чем вычисление отношения интегралов с MC.
Таким образом, вопрос сводится к действительности этого выражения:
При каких обстоятельствах, если таковые имеются, могу ли я сказать, что это соотношение верно?
[исправлена опечатка (EDIT)]
Добавить :
Вот в основном тот же вопрос, но в более математической форме.
P(X)
которое я стараюсь избегать. Не могли бы вы немного рассказать об актуальности этого параметра?Ответы:
KDE представляет собой смесь нормальных распределений. Давайте посмотрим на один из них.
эквивалентно
Теперь рассмотрим смесь. Потому что это линейно,
источник