Winbugs и другие MCMC без информации для предварительного распространения

10

Что происходит, когда у вас нет представления о распределении параметров? Какой подход мы должны использовать?

В большинстве случаев мы стремимся недооценивать, влияет ли определенная переменная на наличие / отсутствие определенного вида, и принимается или нет переменная в соответствии с важностью переменной. Это означает, что в большинстве случаев мы не думаем об ожидаемом распределении, которое должен иметь параметр.

Правильно ли предположить, что все параметры соответствуют нормальному распределению, когда все, что я знаю, это то, что b1, b2, b3 и b4 должны изменяться от -2 до 2, а b0 может варьироваться от -5 до 5?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
Гаго-Сильва
источник
Если у вас нет априора, вы не можете использовать байесовский вывод. И, следовательно, методология MCMC,
Сиань

Ответы:

6

Параметры в линейном предикторе t-распределены . Когда количество записей уходит в бесконечность, оно сходится к нормальному распределению. Так что да, обычно считается правильным предположить нормальное распределение параметров.

В любом случае, в байесовской статистике не нужно предполагать распределение параметров. Обычно вы указываете так называемые неинформативные априоры . Для каждого случая рекомендуются разные неинформативные априоры. В этом случае люди часто используют что-то вроде (вы можете изменить значения, конечно):

dunif(-100000, 100000)

или

dnorm(0, 1/10^10)

Второй вариант предпочтителен, поскольку он не ограничен конкретными значениями. С неинформативными приорами вы не рискуете. Конечно, вы можете ограничить их определенным интервалом, но будьте осторожны.

Таким образом, вы указываете неинформативный априор, и распределение параметров само выйдет! Нет необходимости делать какие-либо предположения по этому поводу.

любознательный
источник
1
К сожалению, это не совсем верно: границы в приведенной выше форме могут повлиять на результат, особенно при проверке гипотез. На мой взгляд, это недостаток Winbugs.
Сиань
@ Сиань - конечно, это то, что я говорю. Вот почему я предпочитаю «нормальная квартира» в этом случае - то есть второй вариант. Возможно с настройкой второго параметра.
Любопытно
1
Хммм, это совсем не квартира ...
Сиань
Вы можете свободно использовать dnorm(0, 1/10^10)или что-то еще
Любопытный
8

К сожалению, безобидные кажущиеся приоры могут быть очень опасными (и даже одурачили некоторых опытных байесов).

Эта недавняя статья предоставляет хорошее введение наряду с методами построения графика для визуализации предшествующего и заднего (обычно маргинальных априорных / задних значений для параметра (ов), представляющих интерес).

Скрытые опасности указания неинформативных априоров. Джон В. Симэн III, Джон В. Симэн-младший и Джеймс Д. Стейми Американский статистик том 66, выпуск 2, май 2012 г., стр. 77–84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

Такие графики, на мой взгляд, должны быть обязательными в любом реальном байесовском анализе, даже если аналитик не нуждается в них - то, что происходит в байесовском анализе, должно быть понятно большинству читателей.

фанерон
источник
2
хорошая ссылка, жаль, что она не доступна свободно.
Любопытно
6

Анализ чувствительности - это, как правило, хороший способ: попробуйте разные приоры и посмотрите, как ваши результаты изменятся вместе с ними. Если они надежны, вы, вероятно, сможете убедить многих в своих результатах. В противном случае, вы, вероятно, захотите как-то количественно оценить, как априоры изменяют результаты.

безумие
источник