Почему

21

Фон

Одним из наиболее часто используемых слабых предшествующих отклонений является обратная гамма с параметрами (Gelman 2006) .αзнак равно0,001,βзнак равно0,001

Однако это распределение имеет 90% CI приблизительно .[3×1019,]

library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))

[1] 3.362941e+19          Inf

Исходя из этого, я понимаю, что дает низкую вероятность того, что дисперсия будет очень высокой, и очень низкая вероятность того, что дисперсия будет менее 1 P ( σ < 1 | α = 0,001 , β = 0,001 ) = 0,006 .яграмм(0,001,0,001)п(σ<1|αзнак равно0,001,βзнак равно0,001)знак равно0,006

pigamma(1, 0.001, 0.001)
[1] 0.006312353

Вопрос

Я что-то упустил или это информативный априор?

Обновление, чтобы уточнить, причина, по которой я рассматривал это «информативно», заключается в том, что он очень твердо заявляет, что дисперсия огромна и выходит за рамки практически любой дисперсии, когда-либо измеренной.

последующее наблюдение: обеспечит ли мета-анализ большого числа оценок отклонений более разумный предварительный результат?


Ссылка

Гельман 2006. Априорные распределения для параметров дисперсии в иерархических моделях . Байесовский анализ 1 (3): 515–533

Дэвид Лебауэр
источник
1
«Настоящий» неинформативный априор не является распределением. Так что нет никакой вероятности, такой как P (сигма <1).
Стефан Лоран

Ответы:

38

Используя обратное гамма-распределение, получаем:

п(σ2|α,β)α(σ2)-α-1ехр(-βσ2)

Легко видеть, что если и α 0, обратная гамма будет приближаться к Джеффрису ранее. Это распределение называется «неинформативным», потому что это правильное приближение к Джеффрису доβ0α0

п(σ2)α1σ2

Что является неинформативным для параметров масштаба, см., Например , страницу 18 здесь , потому что этот предварительный вариант является единственным, который остается инвариантным при изменении масштаба (обратите внимание, что аппроксимация не является инвариантной). Это имеет неопределенный интеграл от который показывает, что он некорректен, если диапазон σ 2 включает в себя либо 0, либо . Но эти случаи - только проблемы в математике, а не в реальном мире. На самом деле никогда не наблюдайте бесконечное значение для дисперсии, и если наблюдаемая дисперсия равна нулю, у вас есть идеальные данные !. Для вас можно установить нижний предел, равный L > 0, а верхний предел, равный Uжурнал(σ2)σ20L>0 , и ваше распределение корректно.U<

Хотя может показаться странным, что это «неинформативно» в том смысле, что оно предпочитает небольшую дисперсию большим, но это только в одном масштабе. Вы можете показать, что имеет неправильное равномерное распределение. Таким образом, этот предварительный вариант не поддерживает какой-либо один масштаб по сравнению с любым другимжурнал(σ2)

Хотя это не имеет прямого отношения к вашему вопросу, я бы предложил «лучшее» неинформативное распределение, выбрав верхний и нижний пределы и U в предшествующих значениях Джеффриса, а не α и β . Обычно границы могут быть установлены довольно легко, если немного подумать о том, что на самом деле означает σ 2 в реальном мире. Если это была ошибка в некоторой физической величине - L не может быть меньше размера атома или наименьшего размера, который вы можете наблюдать в своем эксперименте. Дальше ULUαβσ2LUне может быть больше земли (или солнца, если вы хотите быть по-настоящему консервативным). Таким образом, вы сохраняете свои свойства инвариантности, и это легче до выборки из: возьмите , а затем смоделированное значение как σ 2 ( б ) = exp ( q ( b ) ) .Q(б)~UNяеорм(журнал(L),журнал(U))σ(б)2знак равноехр(Q(б))

probabilityislogic
источник
5
+1 не только за ответ на вопрос, но и за полезные советы.
whuber
Lограмм(σ)
ВеTa2(1,1)F1,1ВеTa2(0,0)
вероятность
1
@probabilityislogic спасибо за объяснение. Если я понимаю, теоретически гамма хороша, потому что ее ярость равна и потому, что она сопряжена с нормой, но при применении эти функции обычно не требуются. Но в чем разница между выборкой из[0,]σ~еИксп(U(Lограмм(L),Lограмм(U))σ~U(L,U)
Дэвид Лебауэр
(0,)αзнак равно1,βзнак равно1/2
10

Это довольно близко к квартире. Его медиана составляет 1,9 E298, почти самое большое число, которое можно представить в плавающей арифметике двойной точности. Как вы указали, вероятность, которую он назначает любому интервалу, который не очень велик, действительно мала. Трудно стать менее информативным, чем это!

Whuber
источник
Спасибо за ваше объяснение. Я сталкивался с проблемами сходимости, и я был удивлен, что так много переменных, с которыми я работаю, имеют среднее значение <1000 (т. Е. Если что-то> 1000 г, то оно измеряется в кг), а отклонения примерно одного порядка величина. Итак, я понимаю, что мне нужно больше априоров, которые включают эту информацию, даже если у меня нет хороших предварительных знаний о ее ценности или о том, как она разделена.
Дэвид Лебауэр
В зависимости от модели ваш задний план может быть очень близок к неправильному при использовании этого предыдущего
JMS