Одинаковые или разные? Байесовский путь

10

Скажем, у меня есть следующая модель:

Poisson(λ){λ1if t<τλ2if tτ

И я делаю выводы из и \ lambda_2, показанных ниже, из моих данных. Есть ли байесовский способ сказать (или количественной оценку) , если \ lambda_1 и \ lambda_2 являются одинаковыми или разными ?λ 2 λ 1 λ 2λ1λ2λ1λ2

Возможно, измерение вероятности того, что λ1 отличается от λ2 ? Или, возможно, с использованием расхождений KL?

Например, как я могу измерить p(λ2λ1) или, по крайней мере, p(λ2>λ1) ?

В общем, если у вас есть постеры, показанные ниже (допустите ненулевые значения PDF везде для обоих), каков хороший способ ответить на этот вопрос?

введите описание изображения здесь

Обновить

Похоже, что на этот вопрос можно ответить двумя способами:

  1. Если у нас есть образцы постеров, мы могли бы посмотреть на долю образцов, где λ1λ2 (или эквивалентно λ2>λ1 ). @ Cam.Davidson.Pilon включил ответ, который решит эту проблему с помощью таких примеров.

  2. Интеграция своего рода различий постеров. И это важная часть моего вопроса. Как будет выглядеть эта интеграция? Предположительно подход выборки приблизил бы этот интеграл, но я хотел бы знать формулировку этого интеграла.

Примечание: приведенные выше графики взяты из этого материала .

Амелио Васкес-Рейна
источник
Вы можете просто рассчитать дисперсию обоих распределений и добавить их. Это разница в средствах. Затем рассчитайте разницу в средних и посмотрите, сколько это стандартных отклонений. Для начала вы можете аппроксимировать оба распределения нормальным и использовать обычные доверительные интервалы для нормального распределения. Это явно разные средства.
Dave31415
2
Внутренняя проверка гипотез является ответом
Стефан Лоран
3
Все необходимые расчеты приведены в моей статье, но я не изучал случай ( - это соотношение двух пуассоновских скоростей)ϕH0:{ϕ=1}ϕ
Стефан Лоран,
Спасибо @ StéphaneLaurent. Ваша статья - отличный указатель, но, похоже, она специфична для пуассоновских процессов. Каково сравнение на высоком уровне, которое может сделать, чтобы оценить, является ли тем же или отличным от ? Должен ли анализ быть конкретным для распределения? λ 1λ2λ1
Амелио Васкес-Рейна
2
Извините @ user023472 У меня нет энергии в эти дни. Смотрите статьи Бернардо, цитируемые в моей статье. «Внутренний» означает, что метод получен из модели и только из нее.
Стефан Лоран

Ответы:

6

Я думаю, что лучший вопрос, они значительно отличаются?

Чтобы ответить на это, нам нужно вычислить . Назовите это количество . Если , то есть равный шанс, что один больше другого. С другой стороны, если действительно близко к 1, то мы можем быть уверены, что yes больше (читай: отличается), чем .P(λ2>λ1)pp0.50pλ2λ1

Как мы вычисляем ? Это тривиально в байесовской структуре MCMC. У нас есть сэмплы сзади, поэтому давайте просто вычислим, что сэмплы из больше, чем :λ 2 λ 1pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Я прошу прощения за то, что не включил это в книгу, я обязательно добавлю это, поскольку я думаю, что это одна из самых полезных идей в байесовском выводе

Cam.Davidson.Pilon
источник
5
Вероятность 1,0 они различны, так как они обе являются непрерывными случайными величинами. Подумайте: каково ваше предварительное предположение, что ? Вы действительно думаете, что они на самом деле равны? (Не обращайте внимания на проверку гипотез: мы живем в реальном мире, где переменные фактически никогда не равны). Смотрите этот пост моего героя, Гельмана. В вычислительном отношении вы можете проверить это с помощью вычислений . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon
1
Вы можете определить, как «не равно» имеет смысл. Например, если в вашем примере любая разница меньше единицы практически не имеет смысла, вы можете посмотреть на и это даст вам значимую статистику дляP(|λ1λ2|>1)P(λ1λ2)
Сэм Диксон,
3
Чтобы добавить к моему предыдущему комментарию, если переменные и были дискретными, есть вероятность, что = . λ 2 λ 2 λ 1λ1λ2λ2λ1
Cam.Davidson.Pilon
1
о боже, я бы не хотел быть в такой ситуации! Это вовлекает противные интегралы. Для большинства моделей вы не можете получить постеры. Даже если бы вы могли, было бы все же лучше использовать компьютер, просто ради получения образцов. Таким образом, примеры> формул для вычислений, как это.
Cam.Davidson.Pilon
2
Вы не измеряете «достаточно больше». Рассмотрим распределение с пиком в нуле, а другое с равными массами в пиках -10, 10. Ваша статистика - ожидаемое значение показателя того, что одна выборка больше другой - дает 0,5, но распределения явно совершенно разные.
Нил Дж
5

λ1λ2Pr(λ1=λ2)=0

Я подозреваю, что вас интересует вероятность того, что и находятся в некотором друг от друга. В этом случае, ответом будет область разности двух задних плотностей на интервале . Большие значения перекрытия указывают на то, что два постериора более похожи.λ 2 ϵ [ - ϵ / 2 , ϵ / 2 ]λ1λ2ϵ[ϵ/2,ϵ/2]

Если вы предпочитаете работать с симулированными результатами (а для большинства задач у нас нет роскоши выбора), просто возьмите пропорцию результатов, где в качестве приблизительного значения.λ2>λ1

Sycorax говорит восстановить Монику
источник
Спасибо. Как ваш ответ связан с некоторыми идеями, обсуждаемыми в комментариях ОП?
Амелио Васкес-Рейна
Извините, но я не знаком ни с одним из этих методов, поэтому не могу комментировать. @ Stéphane_Laurent довольно умный, поэтому я рекомендую просмотреть ссылку, как минимум.
Sycorax говорит восстановить Monica
1
@ user023472 Извините, сегодня у меня нет сил ответить на вопрос о внутреннем расхождении. Он основан на расхождении Кульбака-Лейблера.
Стефан Лоран
@ user777 Это требует исправления . Что если я просто хочу увидеть вероятность или ? p ( λ 2 > λ 1 ) p ( λ 2λ 1 )ϵp(λ2>λ1)p(λ2λ1)
Амелио Васкес-Рейна
Спасибо @ user777. Мне интересен случай, когда у нас нет доступа к образцам. Ранее в вашем посте был интеграл, но вы, кажется, удалили его. Как бы выглядел этот интеграл?
Амелио Васкес-Рейна