У меня есть два набора данных, один из набора физических наблюдений (температуры), и один из множества численных моделей. Я делаю анализ совершенной модели, предполагая, что ансамбль модели представляет собой истинную, независимую выборку, и проверяю, получены ли наблюдения из этого распределения. Рассчитанная мной статистика нормализована и теоретически должна быть стандартным нормальным распределением. Конечно, он не идеален, поэтому я хочу проверить его на пригодность.
Используя частые рассуждения, я мог бы вычислить статистику Крамера-фон Мизеса (или Колмогорова-Смирнова и т. Д.) Или аналогичную и найти значение в таблице, чтобы получить значение p, чтобы помочь мне решить, насколько маловероятно значение I Видите ли, учитывая наблюдения совпадают с моделью.
Каким будет байесовский эквивалент этого процесса? То есть как я могу измерить силу моей уверенности в том, что эти два распределения (моя вычисленная статистика и стандартная норма) различны?
источник
Ответы:
Я бы предложил книгу « Байесовский анализ данных» как отличный источник ответов на этот вопрос (в частности, главу 6) и все, что я собираюсь сказать. Но один из обычных способов, с помощью которых байесовцы решают эту проблему, - это использование задних прогнозирующих значений P (PPP). Прежде чем я расскажу, как PPP решит эту проблему, позвольте мне сначала определить следующую запись:
Пусть - наблюдаемые данные, а θ - вектор параметров. Определим у респ как тиражируемых данных , которые могли бы наблюдавшихся, или, предсказанием думать, как данные мы бы увидеть завтра , если эксперимент , который произвел у сегодня были скопированы с одной и той же модели и тем же значением & thetas , который произвел наблюдаемый данные.Y θ Yрепутация Y θ
Обратите внимание, мы определим распределение учитывая текущее состояние знаний с задним предиктивным распределением р ( у Rep | у ) = ∫ & thetas ; р ( у Rep | & thetas ; ) р ( & thetas ; | у ) д & thetas ;Yрепутация
Теперь мы можем измерить несоответствие между моделью и данными, определив тестовые величины , аспекты данных, которые мы хотим проверить. Тест количество, или несоответствие мера , , является скалярным резюме параметров и данных, используемыми в качестве эталона при сравнении данных для прогнозирования моделирования. Тестовые величины играют роль в байесовской модели проверки, что тестовая статистика играет в классическом тестировании. Определим обозначение T ( y )T( у, θ ) T(у) для тестовой статистики, которая является тестовой величиной, которая зависит только от данных; в байесовском контексте мы можем обобщить статистику теста, чтобы позволить зависимость от параметров модели при их апостериорном распределении.
Классически, p-значение для тестовой статистики равно p C = Pr ( T ( y rep ) ≥ T ( y ) | θ ), где берется вероятность для распределения y rep с фиксированным θ .T(у)
В отличие от классического подхода, проверка байесовской модели не требует специальных методов для обработки «параметров помех». Используя апостериорное моделирование, мы неявно усредняем все параметры в модели.
Дополнительный источник, Эндрю Гельман также имеет очень хороший документ по PPP здесь: http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf
источник
Одна относительно простая возможность: гладкие тесты на пригодность подгонки, например, [1] - которые обрамляют альтернативу с точки зрения плавных отклонений от нуля, построенных ортогональными многочленами (относительно нулевой плотности как весовой функции), будут относительно простыми для переход к байесовскому каркасу, так как коэффициенты полиномов образуют гибкое, но параметрическое расширение нуля.
[1]: Rayner, JCW и DJ Best (1990),
«Плавные тесты на пригодность: обзор»,
Международный статистический обзор , 58 : 1 (апрель), с. 9-17.
источник