Мне задали этот вопрос с в интервью. Есть ли «правильный» ответ?
Предположим, что броски одинаковы, а вероятность голов составляет . Распределение числа голов в 400 бросках должно быть близко к нормальному (200, 10 ^ 2), так что 220 голов - это 2 стандартных отклонения от среднего значения. Вероятность наблюдения такого результата (т.е. более 2 SD от среднего значения в любом направлении) составляет чуть менее 5%.
Интервьюер сказал мне, по сути, «если я наблюдаю что-то> = 2 SD от среднего значения, я заключаю, что происходит что-то еще. Я бы сделал ставку против честности монеты». Это разумно - в конце концов, это то, что делают большинство тестов гипотез. Но это конец истории? Для интервьюера это казалось «правильным» ответом. Здесь я спрашиваю, оправдан ли какой-то нюанс.
Я не мог не отметить, что решение о том, что монета несправедлива, является странным выводом в этом бросающем монету контексте. Правильно ли я это сказал? Я постараюсь объяснить ниже.
Во-первых, я - и я бы предположил, что большинство людей - имеют сильный априор в отношении монет: они, скорее всего, будут честными. Конечно, это зависит от того, что мы подразумеваем под честным - одной из возможностей было бы определение «справедливого» как «имеющего вероятность того, что головы« приблизятся »к 0,5, скажем, от 0,49 до 0,51».
(Кроме того, можно определить «справедливую» , как это означает , что вероятность голов именно 0,50, в этом случае имея совершенно справедливая монета теперь кажется скорее ООН , скорее всего.)
Ваш предшественник может зависеть не только от ваших общих представлений о монетах, но и от контекста. Если вы вытащили монету из собственного кармана, вы можете быть практически уверены, что она справедлива; если ваш друг-маг вытащил его из своего, ваш предшественник мог бы придать больше веса монетам с двумя головами.
В любом случае, легко придумать разумные априоры, которые (i) дают большую вероятность того, что монета будет честной, и (ii) приведут ваш апостериор к тому, чтобы быть очень похожим, даже после наблюдения 220 голов. Затем вы пришли бы к выводу, что монета, скорее всего, будет честной, несмотря на наблюдение результата 2 SD из среднего значения.
Фактически, вы могли бы также создать примеры, когда наблюдение 220 голов за 400 бросков заставляет вашу заднюю сторону придавать больше веса справедливости, например, если все недобросовестные монеты имеют вероятность появления голов в .
Кто-нибудь может пролить свет на это для меня?
После написания этого вопроса я вспомнил, что слышал об этой общей ситуации раньше - разве это не «парадокс» Линдли ?
Whuber поместил в комментариях очень интересную ссылку: « Вы можете загрузить кубик, но нельзя сместить монетку» . Со страницы 3:
Не имеет смысла говорить, что у монеты есть вероятность p голов, потому что она может быть полностью определена способом, которым она подброшена - если она не брошена высоко в воздух быстрым вращением и не захвачена в воздухе не подпрыгивая, в этом случае р = 1/2.
Довольно круто! Это увязывает мой вопрос интересным образом: предположим, мы знаем, что монета «подбрасывается высоко в воздух быстрым вращением и попадает в воздух, не подпрыгивая». Тогда нам определенно не следует отвергать гипотезу о том, что монета справедлива (где «честно» теперь означает «иметь р = 1/2 при подбрасывании описанным выше способом»), потому что у нас фактически есть априор, который возлагает всю вероятность на честная монета Может быть, это в какой-то степени оправдывает, почему мне неудобно отказываться от нуля после того, как 220 голов наблюдаются.
Ответы:
Стандартный байесовский способ решения этой проблемы (без нормальных аппроксимаций) состоит в том, чтобы явно указать ваш предыдущий, объединить его с вашей вероятностью, которая является бета-распределенной. Затем интегрируйте заднюю часть примерно на 50%, скажем, два стандартных отклонения или от 49% до 51% или что угодно.
Если ваше предыдущее убеждение является непрерывным на [0,1] - например, бета (100,100) (это ставит много массы на примерно честные монеты) - тогда вероятность того, что монета справедлива, равна нулю, так как вероятность также непрерывна [0 , 1].
Даже если вероятность того, что монета справедлива, равна нулю, вы обычно можете ответить на любой вопрос, на который вы собираетесь ответить, апостериорно по смещению. Например, каково преимущество казино с учетом апостериорного распределения вероятностей монет.
источник
Скажем, для распределения Бернулли, в данном случае бросок монеты.
Ясно, что это биномиальное распределение , и оно действительно близко к .B(n=400,p=0.5) N(μ=200,σ2=100)
Очевидно, что интервьюер запрашивает результат с доверительным интервалом с или значением .k 95% B(n=400,p=0.5) p B(n=400,p=0.5,k=220)
В байесовском подходе вы предпочитаете, чтобы вместо иp=0.5 π(p=0.5)=0.5 π(p≠0.5)=0.5
Давайте используем некоторые другие более справедливые предварительные которые и . Мы предполагаем, что имеет равномерное распределение в каждом интервале.π(0.49≤p≤0.51)=0.9 π(p<0.49∪p>0.51)=0.1 p
Затем мы можем вычислить апостериорный .P(0.49≤p≤0.51|k=220)
Или весьма вероятно, что априор является нормальным распределением ~ , или мы можем предположить гораздо меньшую дисперсию, такую как .p N(μ=0.5,σ2=0.25) σ2=0.1
Затем мы вычисляем апостериорное распределение как .p f(p|k=220)
Моей репутации недостаточно, чтобы написать комментарий под Вопросом. Вместо этого я напишу здесь что-нибудь о том, что вы не можете выставить монету . @Адриан
Вот что имеем
Вот наша гипотеза
Вот наш результат
Поскольку значение для проверки гипотезы об отклонении либо либо примерно ниже 5%, мы должны принять их обоих. Или мы должны отвергнуть их обоих.p H0 H1
В противном случае мы создаем двойной стандарт для проверки гипотез здесь. Мы не можем принять гипотезу о том, что подбрасывание монеты справедливо и данные эксперимента правильно записаны .
Не имеет смысла говорить, что у монеты есть вероятность p голов
У нас есть результат эксперимента, чтобы подтвердить эту гипотезу.
Если эксперимент повторяется n раз, возможно ли, что у нас есть приоритет для броска монеты как когда n значительно велико?p N(μ=0.5,σ2)
Если это приемлемо, тогда мы можем оценить с 95% -ным доверительным интервалом на основе метода максимальной вероятности.σs
источник