Статистическая концепция, объясняющая, почему у вас меньше шансов перевернуть то же количество голов, что и у хвостов, так как количество переворотов увеличивается?

28

Я работаю над изучением вероятности и статистики, прочитав несколько книг и написав некоторый код, и, моделируя броски монет, я заметил нечто, что показалось мне слегка противоречащим наивной интуиции. Если вы подбрасываете чистую монету раз, соотношение голов и хвостов сходится к 1 при увеличении , как и следовало ожидать. Но с другой стороны, при увеличении становится меньше шансов перевернуть точно такое же количество головок, как у хвостов, и получить соотношение, равное 1.nnn

Например (какой-то вывод из моей программы)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Мой вопрос таков: есть ли в статистике / теории вероятностей понятие / принцип, объясняющий это? Если да, то что это за принцип / концепция?

Ссылка на код, если кому-то интересно посмотреть, как я это сгенерировал.

-- редактировать --

Для чего это стоит, вот как я объяснял это себе раньше. Если вы подбрасываете справедливую монету раз и количество голов, вы в основном генерируете случайное число. Аналогично, если вы делаете то же самое и подсчитываете хвосты, вы также генерируете случайное число. Таким образом, если вы считаете оба, вы действительно генерируете два случайных числа, и когда становится больше, случайные числа становятся больше. И чем больше случайных чисел вы генерируете, тем больше у них шансов «пропустить» друг друга. Что делает это интересным, так это то, что два числа на самом деле связаны в некотором смысле, и их отношение сходится к одному, когда они становятся больше, даже если каждое число является случайным в отдельности. Может быть, это только я, но я нахожу такой аккуратный. нnn

Mindcrime
источник
Вы ищете интуитивные или математические объяснения?
Glen_b
1
И то и другое. Я думаю, что- то понимаю причину в интуитивном смысле, но я хотел бы понять формальные причины этого.
mindcrime
1
Знаете ли вы, как рассчитать биномиальные вероятности и применить их к этой ситуации? Если нет, то поищите его и разработайте расчеты.
Марк Л. Стоун
Вау, есть несколько хороших ответов на этот вопрос. Я чувствую себя плохо из-за того, что мне приходится принимать одно, а не другое. Позвольте мне просто сказать, что я ценю все ответы и всех, кто нашел время, чтобы поделиться своим мнением по этому вопросу.
mindcrime

Ответы:

31

Обратите внимание, что случай, когда количество голов и количество хвостов равны, равнозначно «ровно половине времени, когда вы получаете головы». Итак, давайте продолжим подсчитывать количество головок, чтобы увидеть, составляет ли оно половину количества бросков, или эквивалентно сравнить соотношение головок с 0,5.

Чем больше вы переворачиваете, тем больше возможного количества головок у вас может быть - распределение становится более распределенным (например, интервал для числа головок, содержащих 95% вероятности, будет увеличиваться по мере увеличения числа бросков) Таким образом, вероятность того, что ровно половина головы будет иметь тенденцию уменьшаться, когда мы подбрасываем больше.

Соответственно, доля головок будет принимать больше возможных значений; смотрите здесь, где мы переходим от 100 бросков к 200 броскам:

enter image description here

При 100 бросках мы можем наблюдать пропорцию 0,49 голов, или 0,50 голов, или 0,51 головки (и т. Д., Но между этими значениями ничего нет), но при 200 бросках мы можем наблюдать 0,49 или 0,495, или 0,50, или 0,50, или 0,510 - вероятность имеет больше значений для «покрытия», и поэтому каждый из них будет стремиться получить меньшую долю.

Представьте, что у вас есть бросков с некоторой вероятностью p i получения i голов (мы знаем эти вероятности, но для этой части это не критично), и вы добавляете еще два броска. В 2 n бросках n голов - наиболее вероятный результат ( p n > p n ± 1, и он уменьшается оттуда).2npii2nnpn>pn±1

Какова вероятность наличия голов в 2 n + 2 бросках?n+12n+2

( эти вероятности с помощью q, чтобы мы не путали их с предыдущими; также пусть P (HH) будет вероятностью «голова, голова» в следующих двух бросках и т. Д.)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

т. е. если вы добавите еще два броска монеты, вероятность среднего значения естественно уменьшается, поскольку оно усредняет наиболее вероятное (среднее) значение со средним из меньших значений по обе стороны)

Так до тех пор , пока вы комфортно , что пик будет в середине (для ), Вероятность ровно половина голов должна уменьшаться по мере п идет вверх.2n=2,4,6,...n


На самом деле мы можем показать , что при большом , р п пропорционально уменьшается с 1npn (что неудивительно, поскольку распределение стандартизированного числа головок приближается к норме и дисперсия доли головок уменьшается сростом n).1nn


Как и требовалось, вот код R, который производит что-то похожее на приведенный выше график:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)
Glen_b - Восстановить Монику
источник
1
Я согласен с @RustyStatistician выше в отношении 1000 слов вашей графики. Дополнительный кредит за указатель на код.
TomRoche
Потрясающая фигура и объяснение!
@ Я включил код, который делает все, кроме «200» в названии зеленого цвета.
Glen_b
1
@Glen_b Спасибо за еще один замечательный пост и щедрость обмена строками кода. Прекрасный сюжет! Это трудно признать это, но у меня возникают проблемы с математическим выражением концепции в вашем посте, и , в частности , использование верхнего регистра . P
Антони Пареллада
1
@Antoni просто означает «вероятность получить« голова, голова »на двух дополнительных бросках». Чтобы получить n + 1 голов в 2n + 2 бросках, к 2n броскам вы должны иметь либо n-1 голов (а затем бросить 2 головы), либо n голов (а затем бросить 1 голову), либо n + 1 голову (а затем бросить 0 голов). P(HH)
Glen_b
19

Итак, мы знаем, что закон больших чисел - это то, что гарантирует первое заключение вашего эксперимента, а именно, что, если вы подбрасываете справедливую монету раз, отношение голов к хвостам сходится к 1 с ростом n . nn

Так что никаких проблем нет. Тем не менее, об этом законе больших чисел говорит нам в этом сценарии.

Но теперь подумайте об этой проблеме более интуитивно. Подумайте о подбрасывании монеты несколько раз, например: .n=2,4,8,10

Когда вы дважды подбрасываете монету, то есть , подумайте о возможных сценариях двух переворотов. (Здесь H обозначает головы, а T обозначает хвосты). На кулака флип вы могли бы получить H и на втором флипом вы могли бы получить T . Но это только один способ, которым могли бы возникнуть два сальто. Вы могли бы также получить на первом броске T и на втором броске H , и все другие возможные комбинации. Таким образом, в конце дня, когда вы подбрасываете 2 монеты, возможные комбинации, которые вы можете увидеть на двух бросках, это S = { H H , H T ,n=2HTHTTH и так есть 4 возможных сценария для подбрасывания n = 2 монет.

S={HH,HT,TH,TT}
n=2

Если бы вы подбросили 4 монеты, то возможное количество комбинаций, которые вы могли бы увидеть, было бы и поэтому существует 16 возможных сценариев для подбрасывания n = 4 монет.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Подбрасывание монет приводит к 256 комбинациям.n=8

Подбрасывание монет приводит к 1024 комбинациям.n=10

И, в частности, подбрасывание любого числа монет приводит к 2 n возможным комбинациям.n2n

Теперь давайте попробуем подойти к этой проблеме с вероятностной точки зрения. Оглядываясь назад на случай, когда , мы знаем, что вероятность получить точно такое же количество голов и хвостов (т. Е., Как вы выразились, отношение равно 1) равна P r ( отношение ровно 1 ) = 2.n=2 Когдаn=4, мы знаем, что вероятность получить точно такое же количество голов и хвостов равно Pr(отношение ровно 1)=6

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

n

n

Pr(Ratio of exactly 1)0

И так, чтобы ответить на ваш вопрос. На самом деле то, что вы наблюдаете, является лишь следствием того факта, что будет намного больше комбинаций подбрасываний монет, где количество голов и хвостов не равно по сравнению с количеством комбинаций, где они равны.



Как подсказывает @Mark L. Stone, если вы знакомы с биномиальной формулой и биномиальными случайными переменными, вы можете использовать ее, чтобы показать тот же аргумент.

XnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

n(nn/2)0.5n0n


источник
2
Вы должны сказать немного больше, чем это 0,5N0 как N ... вы также должны сказать что-то о (NN/2)также. (Для сравнения: только потому, что0,5N0, не значит N!0,5N0).
Серебряная рыба
@Glen_b I don't have enough points to comment on your post, but awesome graphic!
Спасибо @RustyStatistician, это очень помогает. Первая часть вашего объяснения в значительной степени совпадает с тем, как я об этом думал, но я еще недостаточно разбираюсь со своей статистикой, чтобы знать, как ее решить с помощью биномиального распределения. Я в основном перечитывал свою книгу один раз, не решая проблем или чего-то еще, и теперь я возвращаюсь назад с самого начала и пишу код для изучения различных аспектов материала.
mindcrime
@mindcrime sounds great! Glad I could help.
5

See Pascal's Triangle.

The likelihood of coin flip outcomes is represented by the numbers along the bottom row. The outcome of equal heads and tails is the middle number. As the tree grows larger (i.e., more flips), the middle number becomes a smaller proportion of the sum of the bottom row.

Joshua O'Brien
источник
1

Хотя отношение голов к хвостам сходится к 1, диапазон возможных чисел становится шире. (Я делаю цифры). Скажем, для 100 бросков вероятность того, что у вас от 45 до 55% голов, составляет 90%. Это 90%, что вы получаете от 45 до 55 голов. 11 возможностей по количеству голов. Около 9% примерно, что вы получаете равное количество голов и хвостов.

Скажем, для 10 000 бросков вероятность составляет 95%, что вы получаете от 49% до 51% голов. Таким образом, соотношение приблизилось к 1. Но теперь у вас от 4900 до 5100 голов. 201 возможность. Шанс равных чисел составляет всего около 0,5%.

А с миллионом бросков вы наверняка получите от 49,9% до 50,1% голов. Это диапазон от 499 000 до 501 000 голов. 2,001 возможностей. Вероятность теперь снижена до 0,05%.

Хорошо, математика была составлена. Но это должно дать вам представление о «почему». Несмотря на то, что соотношение приближается к 1, количество возможностей становится больше, так что попадание ровно в половину головы, в половину хвоста становится все менее вероятным.

Еще один практический эффект: на практике маловероятно, что у вас есть монета, в которой вероятность метания головы равна 50%. Это может быть 49,99371%, если у вас действительно хорошая монета. Для небольшого количества бросков это не имеет значения. Для больших чисел процент голов будет сходиться до 49,99371%, а не 50%. Если количество бросков достаточно велико, бросание 50% и более голов станет очень и очень маловероятным.

gnasher729
источник
0

Что ж, следует отметить, что при четном количестве переворотов (в противном случае вероятность равных переворотов голов и хвостов, разумеется, точно равна нулю), наиболее вероятным результатом всегда будет тот, у которого ровно столько же переворотов голов, сколько отскоков хвостов.

Распределение N сальто задается коэффициентами полинома

(1+Икс2)N,
Так что даже Nвероятность
пNзнак равно2-N(NN/2),

Используя приближение Стирлинга для N!, вы получите что-то вроде

п1πN/2
для вероятности точно N/2 головы (и соответственно хвосты) сальто для Nв целом сальто. Таким образом, абсолютная вероятность этого исхода сходится к 0, но намного медленнее, чем большинство других исходов, при этом крайние случаи переворотов с 0 головами (или, альтернативно, 0 хвостами)2-N,
user95629
источник
2
Ваш ответ может быть улучшен путем тщательного определения количества в ваших выражениях. ЧтоN? Чтоп?
Sycorax сообщает восстановить Monica
0

Предположим, вы дважды подбрасываете монету. Есть четыре возможных результата: ЧЧ, ХТ, ТН и ТТ. В двух из них у вас одинаковое количество голов и хвостов, так что с 50% вероятностью вы получите такое же количество голов и хвостов.

Теперь предположим, что вы подбрасываете монету 4 306 492 102 раза. Ожидаете ли вы 50-процентного шанса, что вы получите ровно 2 153 246 051 голов и 2 153 246 051 хвостов?

Дэниел МакЛори
источник
Нет, моя интуиция сказала мне, что шансы получить точное совпадение были низкими, просто потому, что цифры увеличивались. Но я хотел смоделировать это, чтобы подтвердить свою мысль. Когда я увидел, что так получилось, я был заинтригован формальными рассуждениями о том, почему это так. Мне кажется интересным, что результирующее соотношение сходится к 1, но при этом становится менее вероятным, что оно равно 1.
mindcrime
3
Один из способов думать об этом, что для большого N Есть много способов приблизиться к 50-50, чем для маленьких N,
Даниэль МакЛори