Вы наблюдаете k голов из n бросков. Честная ли монета?

Мне задали этот вопрос с в интервью. Есть ли «правильный» ответ? $(n, k) = (400, 220)$

Предположим, что броски одинаковы, а вероятность голов составляет $p=0.5$ . Распределение числа голов в 400 бросках должно быть близко к нормальному (200, 10 ^ 2), так что 220 голов - это 2 стандартных отклонения от среднего значения. Вероятность наблюдения такого результата (т.е. более 2 SD от среднего значения в любом направлении) составляет чуть менее 5%.

Интервьюер сказал мне, по сути, «если я наблюдаю что-то> = 2 SD от среднего значения, я заключаю, что происходит что-то еще. Я бы сделал ставку против честности монеты». Это разумно - в конце концов, это то, что делают большинство тестов гипотез. Но это конец истории? Для интервьюера это казалось «правильным» ответом. Здесь я спрашиваю, оправдан ли какой-то нюанс.

Я не мог не отметить, что решение о том, что монета несправедлива, является странным выводом в этом бросающем монету контексте. Правильно ли я это сказал? Я постараюсь объяснить ниже.

Во-первых, я - и я бы предположил, что большинство людей - имеют сильный априор в отношении монет: они, скорее всего, будут честными. Конечно, это зависит от того, что мы подразумеваем под честным - одной из возможностей было бы определение «справедливого» как «имеющего вероятность того, что головы« приблизятся »к 0,5, скажем, от 0,49 до 0,51».

(Кроме того, можно определить «справедливую» , как это означает , что вероятность голов именно 0,50, в этом случае имея совершенно справедливая монета теперь кажется скорее ООН , скорее всего.)

Ваш предшественник может зависеть не только от ваших общих представлений о монетах, но и от контекста. Если вы вытащили монету из собственного кармана, вы можете быть практически уверены, что она справедлива; если ваш друг-маг вытащил его из своего, ваш предшественник мог бы придать больше веса монетам с двумя головами.

В любом случае, легко придумать разумные априоры, которые (i) дают большую вероятность того, что монета будет честной, и (ii) приведут ваш апостериор к тому, чтобы быть очень похожим, даже после наблюдения 220 голов. Затем вы пришли бы к выводу, что монета, скорее всего, будет честной, несмотря на наблюдение результата 2 SD из среднего значения.

Фактически, вы могли бы также создать примеры, когда наблюдение 220 голов за 400 бросков заставляет вашу заднюю сторону придавать больше веса справедливости, например, если все недобросовестные монеты имеют вероятность появления голов в . $\{0, 1\}$

Кто-нибудь может пролить свет на это для меня?

После написания этого вопроса я вспомнил, что слышал об этой общей ситуации раньше - разве это не «парадокс» Линдли ?

Whuber поместил в комментариях очень интересную ссылку: « Вы можете загрузить кубик, но нельзя сместить монетку» . Со страницы 3:

Не имеет смысла говорить, что у монеты есть вероятность p голов, потому что она может быть полностью определена способом, которым она подброшена - если она не брошена высоко в воздух быстрым вращением и не захвачена в воздухе не подпрыгивая, в этом случае р = 1/2.

Довольно круто! Это увязывает мой вопрос интересным образом: предположим, мы знаем, что монета «подбрасывается высоко в воздух быстрым вращением и попадает в воздух, не подпрыгивая». Тогда нам определенно не следует отвергать гипотезу о том, что монета справедлива (где «честно» теперь означает «иметь р = 1/2 при подбрасывании описанным выше способом»), потому что у нас фактически есть априор, который возлагает всю вероятность на честная монета Может быть, это в какой-то степени оправдывает, почему мне неудобно отказываться от нуля после того, как 220 голов наблюдаются.

probability hypothesis-testing self-study prior Адриан
источник

Изменится ли какая-либо часть вашего вопроса, если вы интерпретируете «монету» как метафору для некоторого бинарного процесса, о котором вы не знали ранее?

whuber

@whuber Хороший вопрос. Я думаю, что в этом случае я был бы гораздо более готов пойти с «отклонить, когда р <= 0,05», хотя я не совсем уверен, как оправдать это для себя.

Адриан

Другая проблема, которая беспокоит меня, состоит в том, что человек, задававший вопрос, интересовался гипотезой, что точно p = 0,50. Но если вы думаете, что р постоянно распределяется, вероятность этого равна нулю, независимо от того, что вы наблюдаете. Мне кажется гораздо более значимым делать заявления о принадлежности p к некоторому интервалу. Это может быть проблемой в ситуации, когда у меня не было предварительных знаний, и я решил использовать, например, униформу до.

Адриан

Это имеет смысл. Вопрос, сфокусированный на монетах, немного отвлекает, потому что ответы на такие вопросы обычно сводятся к обсуждению физики (и ловкости рук) подбрасывания монет. Вы можете быть шокированы тем, насколько реальная ситуация может отличаться от ваших сильных настоятелей, в зависимости от того, как подброшена монета. «Не имеет смысла говорить, что у монеты есть вероятность голов»

p

$p$ .

whuber

@Adrian DJC MacKay обсуждает эту точную проблему (с n = 250, k = 140) в своем бесплатном учебнике по этой ссылке: inference.phy.cam.ac.uk/itprnn/book.pdf (p63.) Это может быть интересно прочитайте, что он говорит. Он приходит к аналогичному выводу с вами.

Камбала

Ответы:

Стандартный байесовский способ решения этой проблемы (без нормальных аппроксимаций) состоит в том, чтобы явно указать ваш предыдущий, объединить его с вашей вероятностью, которая является бета-распределенной. Затем интегрируйте заднюю часть примерно на 50%, скажем, два стандартных отклонения или от 49% до 51% или что угодно.

Если ваше предыдущее убеждение является непрерывным на [0,1] - например, бета (100,100) (это ставит много массы на примерно честные монеты) - тогда вероятность того, что монета справедлива, равна нулю, так как вероятность также непрерывна [0 , 1].

Даже если вероятность того, что монета справедлива, равна нулю, вы обычно можете ответить на любой вопрос, на который вы собираетесь ответить, апостериорно по смещению. Например, каково преимущество казино с учетом апостериорного распределения вероятностей монет.

Нил Г
источник

+1, но я бы хотел немного дополнить этот ответ. Предположим, что мы определяем справедливую монету как как предполагает ОП, и мы хотим, чтобы в этом случае было нашей предыдущей вероятности. Тогда разумным предварительным условием является , так чтоУчитывая данные в вопросе, апостериорное распределение становится и апостериорная вероятность честной монеты все еще очень велика:

0.49 < p < 0.51

$0.49 < p < 0.51$

99 %

$99\%$

p \sim Beta (8300, 8300)

$p \sim \text{Beta}(8300, 8300)$

P (p \in (0.49, 0.51)) = 0.99003.

$P(p \in (0.49, 0.51)) = 0.99003.$

p | data \sim Beta (8300 + 220, 8300 + 180)

$p|\text{data} \sim \text{Beta}(8300+220, 8300+180)$

P (p \in (0.49, 0.51) | data) = 0.9886.

$P(p \in (0.49, 0.51)|\text{data}) = 0.9886.$

Кнрумси

Скажем, для распределения Бернулли, в данном случае бросок монеты.

Ясно, что это биномиальное распределение , и оно действительно близко к . $B(n=400,p=0.5)$ $N(\mu=200,\sigma^2=100)$

Очевидно, что интервьюер запрашивает результат с доверительным интервалом с или значением . $k$ $95\%$ $B(n=400,p=0.5)$ $p$ $B(n=400,p=0.5,k=220)$

В байесовском подходе вы предпочитаете, чтобы вместо и $p=0.5$ $\pi(p=0.5)=0.5$ $\pi(p\neq0.5)=0.5$

Давайте используем некоторые другие более справедливые предварительные которые и . Мы предполагаем, что имеет равномерное распределение в каждом интервале. $\pi(0.49\leq p\leq0.51)=0.9$ $\pi(p<0.49 \cup p>0.51)=0.1$ $p$

Затем мы можем вычислить апостериорный . $P(0.49\leq p\leq0.51|k=220)$

Или весьма вероятно, что априор является нормальным распределением ~ , или мы можем предположить гораздо меньшую дисперсию, такую как . $p$ $N(\mu=0.5,\sigma^2=0.25)$ $\sigma^2=0.1$

Затем мы вычисляем апостериорное распределение как . $p$ $f(p|k=220)$

Моей репутации недостаточно, чтобы написать комментарий под Вопросом. Вместо этого я напишу здесь что-нибудь о том, что вы не можете выставить монету . @Адриан

Вот что имеем

Результат эксперимента $B(n=400,k=220,p=\theta)$
Теоретическое и экспериментальное исследование You Can't Bias a Coin

Вот наша гипотеза

$H_0:$ монета справедлива или $\hat\theta=0.5$

$H_1$ : данные эксперимента записаны неверно

Вот наш результат

Основываясь на статье « Вы можете загрузить кристалл, но нельзя сместить монетку» , мы принимаем гипотезу . $H_0$
Исходя из результатов эксперимента, согласно которым разница в два раза превышает стандартное отклонение, мы имеем примерно 95% -ный уровень достоверности для принятия гипотезы , что экспериментальное исследование записано неправильно. $H_1$

Поскольку значение для проверки гипотезы об отклонении либо либо примерно ниже 5%, мы должны принять их обоих. Или мы должны отвергнуть их обоих. $p$ $H_0$ $H_1$

В противном случае мы создаем двойной стандарт для проверки гипотез здесь. Мы не можем принять гипотезу о том, что подбрасывание монеты справедливо и данные эксперимента правильно записаны .

Не имеет смысла говорить, что у монеты есть вероятность p голов

У нас есть результат эксперимента, чтобы подтвердить эту гипотезу.

Если эксперимент повторяется n раз, возможно ли, что у нас есть приоритет для броска монеты как когда n значительно велико? $p$ $N(\mu=0.5,\sigma^2)$

Если это приемлемо, тогда мы можем оценить с 95% -ным доверительным интервалом на основе метода максимальной вероятности. $\sigma^s$

Чжан чжао
источник

Спасибо, Чжан. Один крошечный гнид: если вы хотите использовать нормальное распределение для вашего предшествующего по вероятности головок, я бы сказал, что вы должны усечь его так, чтобы p лежало в [0, 1].

Адриан

Конечно, есть много разумных предварительных раздач и соответствующих постеров. Суть моего вопроса более общая: решение о том, что монета несправедлива, кажется мне странным выводом в этом бросающем монету контексте. Что вы думаете об этом - и почему?

Адриан

Удобным предварительным вариантом здесь было бы распределение бета, поскольку оно сопряжено с биномиальной вероятностью. Но опять же, реальная направленность моего вопроса носит более общий характер, чем конкретный предыдущий.

Адриан

Я думаю, причина в том, что вы даете слишком большую вероятность конкретному априору . Я думаю, что если вы измените предыдущее, а именно просто равномерное распределение , и мы построим 95% доверительный интервал для , я думаю, что мы найдем результат очень убедительным, с не лежащим в 95% CI . И мы легко принимаем гипотезу, что монета не справедлива. Особенно в этом случае вы не найдете решение монеты как несправедливым, чтобы быть странным выводом.

π (p = 0.5)

$\pi(p=0.5)$

p \sim U (0, 1)

$p \sim U(0,1)$

E (p) \sim f (p | k = 220)

$E(p) \sim f(p|k=220)$

p = 0.5

$p=0.5$

E (p)

$E(p)$

Чжан Чжао,

@ user777 Нормальное распределение появляется дважды в ответе Чжана, сначала как приближение к биномиальному (большое), а затем как априор для вероятности головок (когда он говорит, что «априор - нормальное распределение p ~ N»). Чжан - ваша статья о том, что Null - это «монета справедлива и данные были правильно записаны», интересна, спасибо за ее публикацию.

Адриан