Когда нельзя распределить выборку по частоте в байесовской апостериорной системе в условиях регрессии?

11

Мои актуальные вопросы приведены в двух последних абзацах, но для их мотивации:

Если я пытаюсь оценить среднее значение случайной величины, которая следует за нормальным распределением с известной дисперсией, я прочитал, что если поставить перед средним равномерное значение, получится апостериорное распределение, пропорциональное функции правдоподобия. В этих ситуациях байесовский доверительный интервал полностью совпадает с доверительным интервалом, установленным для часто встречающихся людей, а апостериорная оценка для байесовского максимума равна оценке максимального правдоподобия для частых.

В простой настройке линейной регрессии,

Y=Xβ+ϵ,ϵN(0,σ2)

положить равномерный перед на и обратную-гамме перед на сг 2 с малыми значениями параметров приводят к задним бета М А Р , который будет очень похож на частотный & beta ; M L E и надежный интервал для заднего распределения из р | X, который будет очень похож на доверительный интервал вокруг оценки максимального правдоподобия. Они не будут точно такими же, потому что до σ 2βσ2β^MAPβ^MLEβ|Xσ2оказывает небольшое количество влияния, и если задняя оценка осуществляются с помощью MCMC моделирования , который будет ввести еще один источник расхождения, но байесовские доверия интервала вокруг р М P и частотного доверительного интервал вокруг беты M L E будет довольно близко друг к другу, и, конечно, по мере увеличения размера выборки они должны сходиться по мере того, как возрастает влияние вероятности, чтобы доминировать над влиянием предыдущего.β^MAPβ^MLE

Но я читал, что существуют также регрессионные ситуации, когда эти почти не эквивалентны. Например, иерархические регрессии со случайными эффектами или логистическая регрессия - это ситуации, когда, как я понимаю, не существует «хороших» объективных или эталонных априоров.

P(β|X)и что у меня нет предварительной информации, которую я хочу включить, почему я не могу приступить к частой оценке максимального правдоподобия в этих ситуациях и интерпретировать полученные оценки коэффициентов и стандартные ошибки как оценки байесовского MAP и стандартные отклонения, и косвенно обрабатывать их «апостериорные» оценки как результат априора, который должен был быть «неинформативным» без попытки найти явную формулировку априора, которая привела бы к такому апостериору? В целом, в рамках регрессионного анализа, когда можно продолжать в том же духе (рассматривать вероятность как апостериорную), а когда - нет? Как насчет частых методов, которые не основаны на вероятности, таких как методы квази-правдоподобия,

Зависит ли ответ от того, является ли моя цель вывода оценочными точками коэффициентов, или вероятностью нахождения коэффициента в определенном диапазоне, или количествами прогнозирующего распределения?

Yakkanomica
источник

Ответы:

6

p

H0pH0

pP(D|H0)P(H0|D)

pθ

L(θ|D)=P(D|θ)

P(θ|D)θ

P(θ|D)posteriorP(D|θ)likelihood×P(θ)prior

p

Таким образом, хотя оценки максимального правдоподобия должны совпадать с байесовскими оценками MAP при одинаковых априорных значениях, вы должны помнить, что они отвечают на другой вопрос.


Коэн, J. (1994). Земля круглая (р <.05). Американский психолог, 49, 997-1003.

Тим
источник
Спасибо за ваш ответ @Tim. Я должен был быть более ясным - я понимаю, что P (D | H) и P (H | D), в общем, не одно и то же, и что частые и байесовские расхождения во мнениях относительно того, уместно ли назначать распределения вероятностей параметрам ( или гипотезы в более общем плане). То, о чем я спрашиваю, - это ситуации, в которых (частое) выборочное распределение оценки будет численно эквивалентно (байесовскому) апостериорному распределению истинного значения параметра.
Якканомица
Продолжение моего предыдущего комментария: Вы писали: «Таким образом, хотя оценки максимального правдоподобия должны совпадать с оценками Байеса по MAP при одинаковых априорных значениях», - я спрашиваю, есть ли ситуации, в которых эти отношения нарушаются - оба с точки зрения точечных оценок и распределений вокруг них.
Якканомица
Одно последнее дополнение - Некоторые люди скажут, что главное достоинство байесовского подхода - это его способность гибко включать в себя предыдущие знания. Для меня привлекательность байесовского подхода заключается в интерпретации - способности назначать распределение вероятности параметру. Необходимость указать приоры является неприятностью. Я хочу знать, в каких ситуациях я могу использовать методы частых исследований, но назначить байесовскую интерпретацию результатам, утверждая, что результаты частых и байесовских измерений численно совпадают при достоверно неинформативных априорах.
Якканомица
2
@ Yakkanomica Я понимаю, это интересный вопрос, но простой ответ (как указано выше) состоит в том, что вы не должны делать такие интерпретации, потому что наиболее часто используемые методы отвечают на другой вопрос, чем байесовский. Точечные оценки ML и MAP должны совпадать, но доверительные интервалы и ИЧР могут различаться и не должны интерпретироваться как взаимозаменяемые.
Тим
Но @Tim, есть ситуации, в которых доверительные интервалы и ИЧР перекрываются. Например, сравните оценки ML на стр.1906 с байесовскими апостериорными оценками (на основе единообразных априорных значений коэффициентов и IG до шкалы) на стр.1908: пример PROC GENMOD . Оценка точки ML и 95% доверительные интервалы очень похожи на байесовскую апостериорную среднюю оценку и интервал 95% HPD.
Якканомица