Я запутался в том, как оценивать апостериорное предиктивное распределение для байесовской линейной регрессии, за пределами основного случая, описанного здесь на странице 3 и скопированного ниже.
Основной случай - это модель линейной регрессии:
Если мы используем либо униформу, предшествующую , с масштабом-Inv предшествующим , ИЛИ нормальным-обратным гамма-предшествующим (см. Здесь ), то апостериорное предиктивное распределение является аналитическим и является учеником t. χ 2 σ 2
Как насчет этой модели?
Когда , но известен, апостериорное предиктивное распределение является многомерным гауссовским. Обычно вы не знаете , но должны оценить это. Может быть, вы скажете его диагональ и каким-то образом сделаете диагональ функцией ковариат. Это обсуждается в главе о линейной регрессии байесовского анализа данных Гельмана .Σ Σ
Существует ли аналитическая форма для апостериорного прогнозирующего распределения в этом случае? Могу ли я просто включить мою оценку этого в многомерный студент т? Если вы оцениваете более одной дисперсии, является ли распределение по-прежнему многовариантным?
Я спрашиваю , потому что у меня есть некоторые уже на руках. Я хочу знать, было ли это более вероятно предсказано, например, линейной регрессией A, линейной регрессией B
Ответы:
Если вы предполагаете униформу до , то для апостериор будет с Чтобы найти прогнозирующее распределение, нам нужно больше информации. Если и условно не зависит от заданного , то Но обычно для этих типов моделей и не являются условно независимыми, вместо этого мы обычно имеемβ β
источник
При неинформативном или многовариантном априоре Normal-Wishart у вас есть аналитическая форма в виде многовариантного распределения Стьюдента для классической многовариантной множественной регрессии. Я думаю, что события в этом документе связаны с вашим вопросом (вам может понравиться Приложение A :-)). Обычно я сравнивал результаты с последующим прогнозным распределением, полученным с помощью WinBUGS, и аналитической формой: они в точности эквивалентны. Проблема становится сложной только тогда, когда у вас есть дополнительные случайные эффекты в моделях со смешанными эффектами, особенно в несбалансированном дизайне.
В общем случае с классическими регрессиями y и ỹ условно независимы (остатки iid)! Конечно, если это не так, то предлагаемое решение здесь не является правильным.
В R (здесь решение для единообразных априоров), если вы сделали модель lm (названную «модель») одного из откликов в вашей модели и назвали ее «моделью», здесь описано, как получить многомерное прогнозирующее распределение
Теперь квантили ysim - это интервалы допуска бета-ожидания от прогнозирующего распределения, вы, конечно, можете напрямую использовать выборочное распределение, чтобы делать все, что вы хотите.
источник