Гиперприорная плотность для иерархической модели Гамма-Пуассона

11

В иерархической модели данных где на практике типичным является выбор значений ( , что среднее значение и дисперсия гамма-распределения примерно соответствуют среднему значению и дисперсии данных (например, Clayton and Kaldor, 1987 "Эмпирические байесовские оценки стандартизированных по возрасту относительных рисков для картирования заболеваний", " Биометрия" ). Очевидно, что это только специальное решение, поскольку оно завышает уверенность исследователя в параметрахy Пуассон ( λ ) λ Гамма ( α , β ) α , β ) yY

Y~Пуассон(λ)
λ~Гамма(α,β)
α,β)Y(α,β)и небольшие флуктуации в реализованных данных могут иметь большие последствия для гамма-плотности, даже если основной процесс генерации данных остается тем же.

Кроме того, в Байесовском анализе данных (2-е издание) Гельман пишет, что этот метод « неаккуратный» ; в книге и в этой статье (начиная со стр. 3232) он вместо этого предлагает выбрать некоторую гиперприорную плотность , аналогично примеру опухолей крысы (начиная со стр. 130).п(α,β)

Хотя ясно, что любое допустимо при условии, что оно дает конечную апостериорную плотность, я не нашел никаких примеров гиперприорных плотностей, которые исследователи использовали для этой проблемы в прошлом. Я был бы очень признателен, если бы кто-то мог указать мне на книги или статьи, в которых использовалась плотность гиперприоров для оценки модели Пуассона-Гаммы. В идеале меня интересует который является относительно плоским и на котором будут доминировать данные, как в примере с опухолью крысы, или обсуждение, сравнивающее несколько альтернативных спецификаций и компромиссы, связанные с каждым.p ( α , β )п(α,β)п(α,β)

Sycorax говорит восстановить Монику
источник

Ответы:

5

На самом деле я не отвечаю на этот вопрос, поскольку я не указываю вам книги или статьи, в которых используется гиперприор, а вместо этого описываю и даю ссылки на материалы о приорах по параметрам гаммы.

Во-первых, обратите внимание, что модель Пуассона-Гаммы приводит к тому, что интегрируется в отрицательное биномиальное распределение с параметрами и . Второй параметр находится в диапазоне . Если вы хотите быть неинформативным, может подойти Джеффрис до . Вы можете поставить априор непосредственно на или проработать изменение переменных, чтобы получить:α β / ( 1 + β ) ( 0 , 1 ) p = β / ( 1 + β ) pλαβ/(1+β)(0,1)пзнак равноβ/(1+β)п

п(β)αβ-1/2(1+β)-1

В качестве альтернативы можно отметить, что является параметром масштаба для гамма-распределения, и, как правило, перед Джеффрисом для параметра масштаба равен . Может показаться странным, что предшествующий Джеффри для отличается между двумя моделями, но сами модели не эквивалентны; один для распределения и другое для распространения . Аргумент в пользу первого состоит в том, что, при условии отсутствия кластеризации, данные действительно распределяются как отрицательные биномиальные , так что априоры помещаются непосредственно в иββ1/ββY|α,βλ|α,β(α,п)αпэто то, что нужно сделать. OTOH, если, например, у вас есть кластеры в данных, где наблюдения в каждом кластере имеют одинаковую , вам действительно нужно как-то смоделировать , и поэтому трактовать как параметр масштаба гамма-распределения будет кажется более подходящим. (Мои мысли на возможно спорную тему.)λλβ

Первый параметр также может быть адресован через приоры Джеффриса. Если мы используем общую технику разработки априорных значений Джеффриса для каждого параметра независимо, а затем формируем объединение (не-Джеффриса), предшествующее как произведение двух однопараметрических априоров, мы получаем априор для параметра формы гамма-распределения. :α

п(α)αPG(1,α)

где функция полигаммы . Неуклюжий, но обрезанный. Вы можете объединить это с любым из приведенных выше приоров Джеффриса, чтобы получить неинформативное совместное предварительное распространение. Комбинируя его с для параметра гамма-шкалы, получаем эталонный априор для параметров Gamma.PG(1,α)знак равноΣязнак равно0(я+α)-21/β

Если мы хотим пойти по маршруту Full Jeffreys, сформировав истинный приоритет Jeffreys для параметров Gamma, мы получим:

п(α,β)ααPG(1,α)-1/β

Однако априорные значения Джеффриса для многомерных параметров часто имеют плохие свойства, а также плохие характеристики сходимости (см. Ссылку на лекцию ). Я не знаю, так ли это для гаммы, но тестирование даст некоторую полезную информацию.

Для получения дополнительной информации о априорных значениях гаммы см. Стр. 13-14 Каталога неинформативных априорных значений , Ян и Бергер. Там также есть много других дистрибутивов. Для обзора Джеффриса и справочных приоров, вот некоторые примечания лекции .

jbowman
источник
Спасибо за очень подробный ответ. Мне понадобится пара часов, чтобы полностью прочитать вспомогательные материалы и в целом переварить содержание поста. Пожалуйста, не принимайте мой медленный темп за отсутствие благодарности.
Sycorax сообщает восстановить Monica