Что происходит, когда у вас нет представления о распределении параметров? Какой подход мы должны использовать?
В большинстве случаев мы стремимся недооценивать, влияет ли определенная переменная на наличие / отсутствие определенного вида, и принимается или нет переменная в соответствии с важностью переменной. Это означает, что в большинстве случаев мы не думаем об ожидаемом распределении, которое должен иметь параметр.
Правильно ли предположить, что все параметры соответствуют нормальному распределению, когда все, что я знаю, это то, что b1, b2, b3 и b4 должны изменяться от -2 до 2, а b0 может варьироваться от -5 до 5?
model {
# N observations
for (i in 1:N) {
species[i] ~ dbern(p[i])
logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] +
b3*var3[i] + b4*var4[i]
}
# Priors
b0 ~ dnorm(0,10)
b1 ~ dnorm(0,10)
b2 ~ dnorm(0,10)
b3 ~ dnorm(0,10)
b4 ~ dnorm(0,10)
}
Ответы:
Параметры в линейном предикторе t-распределены . Когда количество записей уходит в бесконечность, оно сходится к нормальному распределению. Так что да, обычно считается правильным предположить нормальное распределение параметров.
В любом случае, в байесовской статистике не нужно предполагать распределение параметров. Обычно вы указываете так называемые неинформативные априоры . Для каждого случая рекомендуются разные неинформативные априоры. В этом случае люди часто используют что-то вроде (вы можете изменить значения, конечно):
или
Второй вариант предпочтителен, поскольку он не ограничен конкретными значениями. С неинформативными приорами вы не рискуете. Конечно, вы можете ограничить их определенным интервалом, но будьте осторожны.
Таким образом, вы указываете неинформативный априор, и распределение параметров само выйдет! Нет необходимости делать какие-либо предположения по этому поводу.
источник
dnorm(0, 1/10^10)
или что-то ещеК сожалению, безобидные кажущиеся приоры могут быть очень опасными (и даже одурачили некоторых опытных байесов).
Эта недавняя статья предоставляет хорошее введение наряду с методами построения графика для визуализации предшествующего и заднего (обычно маргинальных априорных / задних значений для параметра (ов), представляющих интерес).
Скрытые опасности указания неинформативных априоров. Джон В. Симэн III, Джон В. Симэн-младший и Джеймс Д. Стейми Американский статистик том 66, выпуск 2, май 2012 г., стр. 77–84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938
Такие графики, на мой взгляд, должны быть обязательными в любом реальном байесовском анализе, даже если аналитик не нуждается в них - то, что происходит в байесовском анализе, должно быть понятно большинству читателей.
источник
Анализ чувствительности - это, как правило, хороший способ: попробуйте разные приоры и посмотрите, как ваши результаты изменятся вместе с ними. Если они надежны, вы, вероятно, сможете убедить многих в своих результатах. В противном случае, вы, вероятно, захотите как-то количественно оценить, как априоры изменяют результаты.
источник