Я относительно новичок в байесовской статистике и недавно использовал JAGS для построения иерархических байесовских моделей на разных наборах данных. Хотя я очень доволен результатами (по сравнению со стандартными моделями glm), мне нужно объяснить не статистикам, в чем отличие от стандартных статистических моделей. Особенно я хотел бы проиллюстрировать, почему и когда HBM работают лучше, чем простые модели.
Была бы полезна аналогия, особенно та, которая иллюстрирует некоторые ключевые элементы:
- несколько уровней неоднородности
- необходимость большего количества вычислений, чтобы соответствовать модели
- возможность извлекать больше «сигнала» из тех же данных
Обратите внимание, что ответ должен быть действительно просвещающим аналогом для людей, не являющихся статистиками, а не простым и приятным примером.
bayesian
hierarchical-bayesian
nassimhddd
источник
источник
Ответы:
Я хотел бы проиллюстрировать пример в отношении моделирования, связанного с уровнем заболеваемости раком (как в Johnson and Albert 1999). Это коснется первого и третьего элемента вашего интереса.Nя Икся θя Nя θя
θя θя Икся~ Б я л ( Nя, θя) θя∼ B e t a ( a , b ) p ( D , θ , η| N) = p ( η) ∏Nя = 1Б я н ( хя| Nя, θя) B e t a ( θя| η) η= ( а , б ) η из данных. Если он ограничен константой, то информация не будет между и будет условно независимой. Но, рассматривая как неизвестные, мы позволяем городам с меньшим количеством данных брать статистическую силу из городов с большим количеством данных.
Основная идея состоит в том, чтобы больше байесовских и установочных априоров для априорных значений, чтобы моделировать неопределенность в гиперпараметрах. Это позволяет поток влияния между в этом примере.θi η
θi
Таким образом, проблема заключается в прогнозировании заболеваемости раком в разных городах. Скажем, у нас есть данные о количестве людей в разных городах и количестве людей, которые умерли от рака . Скажем, мы хотим оценить уровень заболеваемости раком . Существуют различные способы их моделирования и, как мы видим, проблемы с каждым из них. Мы увидим, как иерархическое байесовское моделирование может преодолеть некоторые проблемы. 1. Один из способов состоит в том, чтобы проводить оценку отдельно, но мы будем страдать от редкой проблемы с данными и будем недооценивать показатели, как для низкого .x i θ i
θ я θ я θ я х я ~ Б я л ( N я , θ я ) θ я ~ Б е т ( , б ) р ( D , θ , п | Н ) = p ( η ) ∏ N i = 1 B i
2. Еще один подход к решению проблемы разреженных данных состоит в том, чтобы использовать один и тот же для всех городов и связать параметры, но это также очень сильное предположение. 3. Итак, все, что можно сделать, это то, что все похожи в некотором роде, но также с изменениями, характерными для города. Таким образом, можно смоделировать таким образом, чтобы все были взяты из общего дистрибутива. Скажите и Тогда полное совместное распределение будет где . Нам нужно сделать вывод
η = ( a , b ) η θ i η θ i
источник
Когда вы болеете, вы наблюдаете симптомы, но вам нужен диагноз. Если вы не врач, я думаю, вы можете просто найти диагноз, который лучше всего соответствует вашим симптомам. Но то, что сделал бы Ph HBM - это посмотреть на ваши симптомы, их относительную значимость, как они соответствуют / соотносят ваши предыдущие проблемы со здоровьем, проблемы вашей семьи, текущие общие заболевания и условия окружающей среды, вашу слабость, вашу силу ... и затем он объединит эти вещи, используя свои знания, чтобы обновить то, что он догадывается о вашем состоянии здоровья, и даст вам более вероятный диагноз.
Я уверен, что эта аналогия скоро достигнет своего предела, но я думаю, что она может дать хорошее представление о том, чего можно ожидать от HBM, не так ли? (а я не нашел лучшего)
источник