Какая хорошая аналогия иллюстрирует сильные стороны иерархических байесовских моделей?

10

Я относительно новичок в байесовской статистике и недавно использовал JAGS для построения иерархических байесовских моделей на разных наборах данных. Хотя я очень доволен результатами (по сравнению со стандартными моделями glm), мне нужно объяснить не статистикам, в чем отличие от стандартных статистических моделей. Особенно я хотел бы проиллюстрировать, почему и когда HBM работают лучше, чем простые модели.

Была бы полезна аналогия, особенно та, которая иллюстрирует некоторые ключевые элементы:

  • несколько уровней неоднородности
  • необходимость большего количества вычислений, чтобы соответствовать модели
  • возможность извлекать больше «сигнала» из тех же данных

Обратите внимание, что ответ должен быть действительно просвещающим аналогом для людей, не являющихся статистиками, а не простым и приятным примером.

nassimhddd
источник
4
Классическая проблема «восьми школ» кажется хорошим кандидатом на внедрение БМЧ. andrewgelman.com/2014/01/21/…
Sycorax сообщает, что восстановит Монику
2
@ cafe876. Я не вижу, как байесовский характер моделирования является специфическим для вашей точки зрения. Ваш вопрос действительно специфичен для байесовской иерархической модели? или просто к иерархической модели?
peuhp
@peuhp, исходя из моего опыта, байесовская система делает возможным оценку гораздо более сложных моделей.
nassimhddd

Ответы:

3

Я хотел бы проиллюстрировать пример в отношении моделирования, связанного с уровнем заболеваемости раком (как в Johnson and Albert 1999). Это коснется первого и третьего элемента вашего интереса.
Таким образом, проблема заключается в прогнозировании заболеваемости раком в разных городах. Скажем, у нас есть данные о количестве людей в разных городах и количестве людей, которые умерли от рака . Скажем, мы хотим оценить уровень заболеваемости раком . Существуют различные способы их моделирования и, как мы видим, проблемы с каждым из них. Мы увидим, как иерархическое байесовское моделирование может преодолеть некоторые проблемы. 1. Один из способов состоит в том, чтобы проводить оценку отдельно, но мы будем страдать от редкой проблемы с данными и будем недооценивать показатели, как для низкого .x i θ iNixiθi
θ я θ я θ я х я ~ Б я л ( N я , θ я ) θ я ~ Б е т ( , б ) р ( D , θ , п | Н ) = p ( η ) N i = 1 B iNi
2. Еще один подход к решению проблемы разреженных данных состоит в том, чтобы использовать один и тот же для всех городов и связать параметры, но это также очень сильное предположение. 3. Итак, все, что можно сделать, это то, что все похожи в некотором роде, но также с изменениями, характерными для города. Таким образом, можно смоделировать таким образом, чтобы все были взяты из общего дистрибутива. Скажите и Тогда полное совместное распределение будет где . Нам нужно сделать выводθi
θiθixiBin(Ni,θi)θiBeta(a,b)
η = ( a , b ) η θ i η θ ip(D,θ,η|N)=p(η)i=1NBin(xi|Ni,θi)Beta(θi|η)η=(a,b)ηиз данных. Если он ограничен константой, то информация не будет между и будет условно независимой. Но, рассматривая как неизвестные, мы позволяем городам с меньшим количеством данных брать статистическую силу из городов с большим количеством данных. Основная идея состоит в том, чтобы больше байесовских и установочных априоров для априорных значений, чтобы моделировать неопределенность в гиперпараметрах. Это позволяет поток влияния между в этом примере.θiη
θi

dksahuji
источник
Спасибо, это действительно хороший пример, но это не аналогия. Я действительно ищу что-то, что могу объяснить не статистику.
nassimhddd
Я предполагаю, что разделение и изменение на разных уровнях могут использоваться для не статистиков.
dksahuji
это правда, но разве нет более простой истории, чтобы проиллюстрировать это?
nassimhddd
3

Когда вы болеете, вы наблюдаете симптомы, но вам нужен диагноз. Если вы не врач, я думаю, вы можете просто найти диагноз, который лучше всего соответствует вашим симптомам. Но то, что сделал бы Ph HBM - это посмотреть на ваши симптомы, их относительную значимость, как они соответствуют / соотносят ваши предыдущие проблемы со здоровьем, проблемы вашей семьи, текущие общие заболевания и условия окружающей среды, вашу слабость, вашу силу ... и затем он объединит эти вещи, используя свои знания, чтобы обновить то, что он догадывается о вашем состоянии здоровья, и даст вам более вероятный диагноз.

Я уверен, что эта аналогия скоро достигнет своего предела, но я думаю, что она может дать хорошее представление о том, чего можно ожидать от HBM, не так ли? (а я не нашел лучшего)

peuhp
источник
Мне нравится эта аналогия! Может быть, немного уточню это, добавив, что можно добавить, что некоторые симптомы более значимы для определенных потенциальных выводов (результатов анализов крови), чем другие (иногда немного болит левый икра)
MikeP
Хороший пример ... где я думаю, что это не дотягивает до того, что кажется, что сила HBM заключается в доступе к БОЛЬШЕ информации (история, семья и т. Д.); в то время как я хочу выразить, что HBM более изощрен с той же информацией. Есть ли способ адаптировать вашу историю?
nassimhddd
@ cafe876. Спасибо, дай мне немного времени подумать об этом.
peuhp