Я хотел бы найти несколько «реальных примеров» для преподавания байесовской статистики. Байесовская статистика позволяет формально включить предыдущие знания в анализ. Я хотел бы привести студентам несколько простых примеров из реальной жизни, в которых исследователи включили в свой анализ предшествующие знания, чтобы студенты могли лучше понять мотивацию, по которой можно в первую очередь использовать байесовскую статистику.
Известны ли вам какие-либо простые примеры из реальной жизни, такие как оценка среднего значения, пропорции, регрессии и т. Д., Где исследователи официально включают в себя предварительную информацию? Я понимаю, что байесовцы могут использовать «неинформативные» приоры, но меня особенно интересуют реальные примеры, где используются информативные приоры (то есть реальная априорная информация).
Ответы:
Байесовская теория поиска представляет собой интересное в реальном времени приложение байесовской статистики, которая много раз применялась для поиска потерянных судов в море. Для начала карта делится на квадраты. Каждому квадрату присваивается предшествующая вероятность удержания потерянного судна на основе последней известной позиции, курса, пропущенного времени, течений и т. Д. Кроме того, каждому квадрату назначается условная вероятность обнаружения судна, если оно действительно находится в этом квадрате, на основе такие вещи, как глубина воды. Эти распределения объединяются, чтобы расставить приоритеты квадратов карты, которые имеют наибольшую вероятность получения положительного результата - это не обязательно самое вероятное место для корабля, но наиболее вероятное место фактического нахождения корабля.
источник
Я думаю, что оценка производства или численности населения по серийным номерам интересна, если использовать традиционный пояснительный пример. Здесь вы пытаетесь максимально дискретного равномерного распределения. В зависимости от выбранного вами предварительного значения максимальная вероятность и байесовские оценки будут различаться довольно прозрачно.
Пожалуй, самый известный пример - это оценка скорости производства немецких танков во время второй мировой войны по диапазонам серийных номеров танков и кодам производителей, выполненным в установках для частых исследований (Ruggles and Brodie, 1947). Альтернативный анализ с байесовской точки зрения с информативными априорами был сделан (Дауни, 2013), а с неподходящими неинформативными априорами - (Höhle and Held, 2004). Работа (Höhle and Held, 2004) также содержит намного больше ссылок на предыдущее обращение в литературе, и на этом сайте также обсуждается эта проблема.
Источники:
Глава 3, Дауни, Аллен. Подумайте, Байес: Байесовская статистика в Python. "O'Reilly Media, Inc.", 2013.
Википедия
Ruggles, R .; Brodie, H. (1947). «Эмпирический подход к экономической разведке во Второй мировой войне». Журнал Американской статистической ассоциации. 42 (237): 72.
Хёле, Михаэль и Леонард Хельд. Байесовская оценка численности населения. № 499. Дискуссионный документ // Sonderforschungsbereich 386 der Ludwig-Maximilians-Universität München, 2006.
источник
В статистике пространственно -временных данных Кайли и Уикла есть хорошая история о (байесовском) поиске подводной лодки «Скорпион», потерянной в 1968 году. Мы рассказываем эту историю нашим студентам и просим их выполнить ( упрощенно) поиск с использованием симулятора .
Подобные примеры могут быть построены вокруг истории пропавшего полета MH370; Возможно, вы захотите взглянуть на Davey et al., Байесовские методы в поиске MH370 , Springer-Verlag.
источник
Вот пример оценки среднего значения из нормальных непрерывных данных. Прежде чем углубиться непосредственно в пример, я хотел бы рассмотреть некоторые математические расчеты для нормальных и нормальных байесовских моделей данных.θ
Рассмотрим случайную выборку из п непрерывные значения , обозначаемые . При этом вектор у = ( у 1 , . . . , У п ) Т представляет собой данные , собранные. Вероятностная модель для нормальных данных с известной дисперсией и независимыми и одинаково распределенными (iid) выборкамиy1,...,yn y=(y1,...,yn)T
Или, как более типично написано байесовским,
где ; τ известен как точностьτ=1/σ2 τ
В этих обозначениях плотность для равнаyi
Классическая статистика (т.е. максимального правдоподобия) дает нам оценку θ = ˉ уθ^=y¯
В байесовской перспективе мы добавляем максимальную вероятность с предварительной информацией. Выбор априорных значений для этой нормальной модели данных является еще одним нормальным распределением для . Нормальное распределение сопряжено с нормальным распределением.θ
Апостериорное распределение, которое мы получаем из этой модели данных Normal-Normal (после множества алгебр), является еще одним нормальным распределением.
Тем не менее, теперь вы можете использовать любой пример учебника с обычными данными, чтобы проиллюстрировать это. Я буду использовать набор данных
airquality
в R. Рассмотрим проблему оценки средней скорости ветра (MPH).В этом анализе исследователь (вы) может сказать, что, учитывая данные + предварительную информацию, ваша оценка среднего ветра с использованием 50-го процентиля скорости должна быть 10,00324, что больше, чем просто использование среднего значения из данных. Вы также получаете полный дистрибутив, из которого вы можете извлечь доверительный интервал 95%, используя квантили 2,5 и 97,5.
Ниже я приведу две ссылки, я настоятельно рекомендую прочитать небольшую статью Казеллы. Он специально нацелен на эмпирические байесовские методы, но объясняет общую байесовскую методологию для нормальных моделей.
Ссылки:
Казелла Г. (1985). Введение в эмпирический байесовский анализ данных. Американский статистик, 39 (2), 83-87.
Гельман А. (2004). Байесовский анализ данных (2-е изд., Тексты по статистике). Boca Raton, Fla .: Chapman & Hall / CRC.
источник
Область исследований, где я считаю, что байесовские методы абсолютно необходимы, - это оптимальное проектирование.
источник
В последнее время я размышлял над этим вопросом и думаю, что у меня есть пример, в котором байесовский смысл имеет смысл с использованием предварительной вероятности: отношения вероятности клинического теста.
Примером может служить следующий пример: допустимость опускания мочи в условиях ежедневной практики (Family Practice 2003; 20: 410-2). Идея состоит в том, чтобы увидеть, что положительный результат мочеиспускания влияет на диагностику инфекции мочи. Коэффициент вероятности положительного результата:
Здесь тест полезен для выявления инфекции, но не настолько хорош, чтобы отказаться от инфекции.
источник