Учет дискретных или двоичных параметров в байесовском информационном критерии

9

BIC штрафует в зависимости от количества параметров. Что если некоторые из параметров являются своего рода переменными двоичного индикатора? Они считаются полными параметрами? Но я могу объединить двоичных параметров в одну дискретную переменную, которая принимает значения в . Они должны учитываться как параметров или как один параметр?{ 0 , 1 , . , , , 2 м - 1 } мм{0,1,,,,,2м-1}м

высокая пропускная способность
источник

Ответы:

3

Отчасти из-за этой неточности в «количестве параметров» в BIC DIC ( информационный критерий отклонения ) ввел эффективное количество параметров как где и Обратите внимание, что зависит от данных. (Как уже говорилось там , DIC также имеет свои собственные проблемы!)

пD(Икс)знак равноЕ[D(θ)|Икс]-D(Е[θ|Икс])
D(θ)знак равно-2журнале(Икс|θ)
DIC(Икс)знак равнопD(Икс)+Е[D(θ)|Икс]
пD(Икс)
Сиань
источник
Е[Lогп(Y|MоdеL)]знак равножурнал(п(Y|θ)пмоdеL(θ)dθ)
1
Да, BIC является приблизительным значением предельной вероятности. Тем не менее, это только приближение, которое сходится к «истине», когда размер выборки увеличивается до бесконечности. Поэтому он не является напрямую байесовским (не использует предшествующее, во-первых!) И совершенно не связан с MCMC (где приближение имеет тип Монте-Карло: если я увеличу количество симуляций, приближение улучшится). DIC считается более байесовским для многих (в том числе Б. Карлина и Д. Шпигельхатлера)
Сиань
Я предполагаю, что мой вопрос был, является ли DIC приближением вероятности предельной модели тоже? Думаю, мне следует прочитать об этом самому, но так как мы обсуждали это, я подумал, что объяснение этого сделает ответ более полным. Спасибо!
highBandWidth