Зачем использовать бета-распределение по параметру Бернулли для иерархической логистической регрессии?

13

В настоящее время я читаю превосходную книгу Крушке «Анализ байесовских данных». Однако глава об иерархической логистической регрессии (глава 20) несколько сбивает с толку.

Рисунок 20.2 описывает иерархическую логистическую регрессию, где параметр Бернулли определяется как линейная функция на коэффициентах, преобразованных через сигмовидную функцию. Похоже, именно таким образом иерархическая логистическая регрессия представлена ​​в большинстве примеров, которые я видел и в других источниках в Интернете. Например - http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug

Однако, когда предикторы являются номинальными, он добавляет слой в иерархию - теперь параметр Бернулли взят из бета-распределения (рис. 20.5) с параметрами, определенными mu и kappa, где mu - сигмоидальное преобразование линейной функции коэффициентов. , а каппа использует гамму априора.

Это кажется разумным и аналогичным примеру с бросанием монет из главы 9, но я не вижу, что делать с номинальными предикторами при добавлении бета-распределения. Почему бы не сделать это в случае метрических предикторов и почему было добавлено бета-распределение для номинальных предикторов?

РЕДАКТИРОВАТЬ: Разъяснение по моделям, я имею в виду. Во-первых, модель логистической регрессии с метрическими предикторами (без бета-версии). Это похоже на другие примеры иерархической логистической регрессии, такие как пример ошибок:

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

Тогда пример с номинальными предикторами. Вот где я не совсем понимаю роль «нижнего» уровня иерархии (включение логистического результата в бета-версию до бинома) и почему она должна отличаться от метрического примера.

ziBin(θi,N)θiBeta(aj,bj)aj=μjκbj=(1μj)κκΓ(Sκ,Rκ)μj=sig(β0+jβjxji)β0N(M0,T0)βjN(0,τβ)τβ=1/σβ2σβ2folded t(Tt,DF)
user4733
источник

Ответы:

9

Две модели, которые вы сравниваете, имеют много посторонних функций, и я думаю, что вы можете сформулировать свой вопрос более четко в контексте следующих двух упрощенных моделей:

Модель 1:

yi|μiBern(μi)μiπ(μi)

Модель 2:

yi|θiBern(θi)θi|μi,κBeta(μiκ,(1μi)κ)μiπ(μi)

Ваши вопросы: (1) какую роль играет бета-дистрибутив; и связанные, (2) как (если вообще) модель 2 отличается от модели 1?

На первый взгляд это довольно разные модели, но на самом деле предельные распределения в обеих моделях идентичны. Апостериорное распределение в модели 1: тогда как маргинальное заднее распределение в модели 2: μiμi

p(μi|yi)μiyi(1μi)1yiπ(μi)
μi
p(μi|yi,κ)01θiyi+μiκ1(1θi)κ(1μi)yiB(κμi,κ(1μi))dθπ(μi)B(yi+μiκ,1yi+κ(1μi))π(μi)B(κμi,κ(1μi))μiyi(1μi)1yiπ(μi)

Таким образом, любое преимущество, полученное от использования Модели 2, является вычислительным. Чрезмерная параметризация иерархических моделей, таких как добавление в Модель 2, иногда может повысить эффективность процедуры выборки; например, путем введения условно-сопряженных отношений между группами параметров (см. ответ Джека Таннера) или путем нарушения корреляции между интересующими параметрами (Google «Расширение параметров»).θi

jmtroos
источник
5

Причина получения параметра Бернулли из бета-распределения состоит в том, что бета сопряжена с биномом. Использование сопряженного предварительного распределения позволяет найти решение в задней части в закрытом виде.

РЕДАКТИРОВАТЬ: уточнение. Любая модель будет работать. Даже с MCMC полезно иметь сопряженные априоры, поскольку это позволяет использовать специализированные сэмплеры для различных типов распределений, которые более эффективны, чем универсальные сэмплеры. Например, см. Руководство пользователя JAGS с. 4.1.1 и с 4.2.

Джек Таннер
источник
В моем вопросе может быть недостаточно контекста из книги, но эти анализы выполняются с использованием выборки Гиббса, поэтому представление задней части в закрытой форме не требуется. В приведенном мною примере параметр Бернулли не фиксируется как бета-распределение, а возникает в результате сигмовидного преобразования линейных предикторов, которые имеют нормально распределенные коэффициенты. Так же и в этой главе Крушке представляет более ранний пример (с метрическими предикторами) (параметр Бернулли - это просто сигмовидное преобразование линейной функции с нормально распределенными коэффициентами)
user4733
@ user4733 Джек Таннер прав в том, что бета является конъюгатом до образцов Бернулли. кажется, что это не просто совпадение, что он был выбран. Да, вы можете делать выборку Гиббса, чтобы получить апостериорное распределение, но в иерархической модели задействовано более одного априора, и может случиться так, что вы устанавливаете априор на гиперпараметр (параметр для семейства априорных распределений. перед на предшествующее , если вы будете в этом контексте может быть удобно использовать конъюгат до некоторых из вашего описания книги путает нам...
Майкл Р. Chernick
1
Вы берете небольшие выдержки, которые создают пробелы в нашей способности понять, что происходит. Вам нужно описать модель и иерархию приоров, чтобы мы лучше помогли (по крайней мере, мне)>
Майкл Р. Черник
Добавлены некоторые описания к иерархическим моделям, на которые я ссылаюсь. Надеюсь, это поможет.
user4733