Если у нас небольшой размер выборки, сильно ли повлияет предварительное распределение на последующее?
bayesian
sample-size
prior
Тоби Дж
источник
источник
Ответы:
Да. Апостериорное распределение для параметра заданном наборе данных X можно записать в видеθ Икс
или, как это чаще всего отображается на шкале журнала,
Логарифмическая вероятность, , масштабируется в зависимости от размера выборки , поскольку она является функцией данных, в то время как предыдущая плотность - нет. Следовательно, с увеличением размера выборки абсолютное значение L ( θ ; X ) увеличивается, в то время как log ( p ( θ ) ) остается фиксированным (для фиксированного значения θ ), таким образом, сумма L ( θ ; X +)L ( θ ; X ) = log( p ( X | θ ) ) L ( θ ; X ) журнал( р ( θ ) ) θ становится сильнее под влиянием L ( θ ; X )L(θ;X)+log(p(θ)) L(θ;X) при увеличении размера выборки.
Поэтому, чтобы прямо ответить на ваш вопрос - предварительное распределение становится все менее и менее актуальным, поскольку вероятность его перевешивает. Таким образом, для небольшого размера выборки предшествующее распределение играет гораздо большую роль. Это согласуется с интуицией, так как можно ожидать, что предыдущие спецификации будут играть большую роль, когда нет большого количества данных, чтобы их опровергнуть, тогда как, если размер выборки очень велик, сигнал, присутствующий в данных, перевесит любые априорные значения. убеждения были заложены в модель.
источник
Вот попытка проиллюстрировать последний абзац в превосходном (+1) ответе Макроса. Он показывает два априора для параметра в распределении B i n o m i a l ( n , p ) . Для нескольких различных n задние распределения показаны, когда наблюдается x = n / 2 . В п растет, оба апостериорные становятся все более и более сосредоточены вокруг 1 / 2 .п Б я н о м я л (п,р) N х = н / 2 N 1 / 2
источник