Я работаю над изучением вероятности и статистики, прочитав несколько книг и написав некоторый код, и, моделируя броски монет, я заметил нечто, что показалось мне слегка противоречащим наивной интуиции. Если вы подбрасываете чистую монету раз, соотношение голов и хвостов сходится к 1 при увеличении , как и следовало ожидать. Но с другой стороны, при увеличении становится меньше шансов перевернуть точно такое же количество головок, как у хвостов, и получить соотношение, равное 1.
Например (какой-то вывод из моей программы)
For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)
Мой вопрос таков: есть ли в статистике / теории вероятностей понятие / принцип, объясняющий это? Если да, то что это за принцип / концепция?
Ссылка на код, если кому-то интересно посмотреть, как я это сгенерировал.
-- редактировать --
Для чего это стоит, вот как я объяснял это себе раньше. Если вы подбрасываете справедливую монету раз и количество голов, вы в основном генерируете случайное число. Аналогично, если вы делаете то же самое и подсчитываете хвосты, вы также генерируете случайное число. Таким образом, если вы считаете оба, вы действительно генерируете два случайных числа, и когда становится больше, случайные числа становятся больше. И чем больше случайных чисел вы генерируете, тем больше у них шансов «пропустить» друг друга. Что делает это интересным, так это то, что два числа на самом деле связаны в некотором смысле, и их отношение сходится к одному, когда они становятся больше, даже если каждое число является случайным в отдельности. Может быть, это только я, но я нахожу такой аккуратный. н
источник
Ответы:
Обратите внимание, что случай, когда количество голов и количество хвостов равны, равнозначно «ровно половине времени, когда вы получаете головы». Итак, давайте продолжим подсчитывать количество головок, чтобы увидеть, составляет ли оно половину количества бросков, или эквивалентно сравнить соотношение головок с 0,5.
Чем больше вы переворачиваете, тем больше возможного количества головок у вас может быть - распределение становится более распределенным (например, интервал для числа головок, содержащих 95% вероятности, будет увеличиваться по мере увеличения числа бросков) Таким образом, вероятность того, что ровно половина головы будет иметь тенденцию уменьшаться, когда мы подбрасываем больше.
Соответственно, доля головок будет принимать больше возможных значений; смотрите здесь, где мы переходим от 100 бросков к 200 броскам:
При 100 бросках мы можем наблюдать пропорцию 0,49 голов, или 0,50 голов, или 0,51 головки (и т. Д., Но между этими значениями ничего нет), но при 200 бросках мы можем наблюдать 0,49 или 0,495, или 0,50, или 0,50, или 0,510 - вероятность имеет больше значений для «покрытия», и поэтому каждый из них будет стремиться получить меньшую долю.
Представьте, что у вас есть бросков с некоторой вероятностью p i получения i голов (мы знаем эти вероятности, но для этой части это не критично), и вы добавляете еще два броска. В 2 n бросках n голов - наиболее вероятный результат ( p n > p n ± 1, и он уменьшается оттуда).2n pi i 2n n pn>pn±1
Какова вероятность наличия голов в 2 n + 2 бросках?n+1 2n+2
( эти вероятности с помощью q, чтобы мы не путали их с предыдущими; также пусть P (HH) будет вероятностью «голова, голова» в следующих двух бросках и т. Д.)q
т. е. если вы добавите еще два броска монеты, вероятность среднего значения естественно уменьшается, поскольку оно усредняет наиболее вероятное (среднее) значение со средним из меньших значений по обе стороны)
Так до тех пор , пока вы комфортно , что пик будет в середине (для ), Вероятность ровно половина голов должна уменьшаться по мере п идет вверх.2n=2,4,6,... n
На самом деле мы можем показать , что при большом , р п пропорционально уменьшается с 1n pn (что неудивительно, поскольку распределение стандартизированного числа головок приближается к норме и дисперсия доли головок уменьшается сростом n).1n√ n
Как и требовалось, вот код R, который производит что-то похожее на приведенный выше график:
источник
Итак, мы знаем, что закон больших чисел - это то, что гарантирует первое заключение вашего эксперимента, а именно, что, если вы подбрасываете справедливую монету раз, отношение голов к хвостам сходится к 1 с ростом n .n n
Так что никаких проблем нет. Тем не менее, об этом законе больших чисел говорит нам в этом сценарии.
Но теперь подумайте об этой проблеме более интуитивно. Подумайте о подбрасывании монеты несколько раз, например: .n=2,4,8,10
Когда вы дважды подбрасываете монету, то есть , подумайте о возможных сценариях двух переворотов. (Здесь H обозначает головы, а T обозначает хвосты). На кулака флип вы могли бы получить H и на втором флипом вы могли бы получить T . Но это только один способ, которым могли бы возникнуть два сальто. Вы могли бы также получить на первом броске T и на втором броске H , и все другие возможные комбинации. Таким образом, в конце дня, когда вы подбрасываете 2 монеты, возможные комбинации, которые вы можете увидеть на двух бросках, это S = { H H , H T ,n=2 H T H T T H
и так есть 4 возможных сценария для подбрасывания n = 2 монет.
Если бы вы подбросили 4 монеты, то возможное количество комбинаций, которые вы могли бы увидеть, было бы и поэтому существует 16 возможных сценариев для подбрасывания n = 4 монет.
Подбрасывание монет приводит к 256 комбинациям.n=8
Подбрасывание монет приводит к 1024 комбинациям.n=10
И, в частности, подбрасывание любого числа монет приводит к 2 n возможным комбинациям.n 2n
Теперь давайте попробуем подойти к этой проблеме с вероятностной точки зрения. Оглядываясь назад на случай, когда , мы знаем, что вероятность получить точно такое же количество голов и хвостов (т. Е., Как вы выразились, отношение равно 1) равна P r ( отношение ровно 1 ) = 2.n=2
Когдаn=4, мы знаем, что вероятность получить точно такое же количество голов и хвостов равно
Pr(отношение ровно 1)=6
И так, чтобы ответить на ваш вопрос. На самом деле то, что вы наблюдаете, является лишь следствием того факта, что будет намного больше комбинаций подбрасываний монет, где количество голов и хвостов не равно по сравнению с количеством комбинаций, где они равны.
Как подсказывает @Mark L. Stone, если вы знакомы с биномиальной формулой и биномиальными случайными переменными, вы можете использовать ее, чтобы показать тот же аргумент.
источник
See Pascal's Triangle.
The likelihood of coin flip outcomes is represented by the numbers along the bottom row. The outcome of equal heads and tails is the middle number. As the tree grows larger (i.e., more flips), the middle number becomes a smaller proportion of the sum of the bottom row.
источник
Maybe it helps to outline that this is related to the arcsine law. It says that for one path of outcomes the probability that the path stays for most the time in the positive or negative domain is much higher than that it is going up and down than you expect from intuition. Here some links:
http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml
https://en.wikipedia.org/wiki/Arcsine_law
источник
Хотя отношение голов к хвостам сходится к 1, диапазон возможных чисел становится шире. (Я делаю цифры). Скажем, для 100 бросков вероятность того, что у вас от 45 до 55% голов, составляет 90%. Это 90%, что вы получаете от 45 до 55 голов. 11 возможностей по количеству голов. Около 9% примерно, что вы получаете равное количество голов и хвостов.
Скажем, для 10 000 бросков вероятность составляет 95%, что вы получаете от 49% до 51% голов. Таким образом, соотношение приблизилось к 1. Но теперь у вас от 4900 до 5100 голов. 201 возможность. Шанс равных чисел составляет всего около 0,5%.
А с миллионом бросков вы наверняка получите от 49,9% до 50,1% голов. Это диапазон от 499 000 до 501 000 голов. 2,001 возможностей. Вероятность теперь снижена до 0,05%.
Хорошо, математика была составлена. Но это должно дать вам представление о «почему». Несмотря на то, что соотношение приближается к 1, количество возможностей становится больше, так что попадание ровно в половину головы, в половину хвоста становится все менее вероятным.
Еще один практический эффект: на практике маловероятно, что у вас есть монета, в которой вероятность метания головы равна 50%. Это может быть 49,99371%, если у вас действительно хорошая монета. Для небольшого количества бросков это не имеет значения. Для больших чисел процент голов будет сходиться до 49,99371%, а не 50%. Если количество бросков достаточно велико, бросание 50% и более голов станет очень и очень маловероятным.
источник
Что ж, следует отметить, что при четном количестве переворотов (в противном случае вероятность равных переворотов голов и хвостов, разумеется, точно равна нулю), наиболее вероятным результатом всегда будет тот, у которого ровно столько же переворотов голов, сколько отскоков хвостов.
РаспределениеN сальто задается коэффициентами полинома
Используя приближение Стирлинга длян ! , вы получите что-то вроде
источник
Предположим, вы дважды подбрасываете монету. Есть четыре возможных результата: ЧЧ, ХТ, ТН и ТТ. В двух из них у вас одинаковое количество голов и хвостов, так что с 50% вероятностью вы получите такое же количество голов и хвостов.
Теперь предположим, что вы подбрасываете монету 4 306 492 102 раза. Ожидаете ли вы 50-процентного шанса, что вы получите ровно 2 153 246 051 голов и 2 153 246 051 хвостов?
источник