Каково распределение разных многогранных кубиков, одновременно раскатанных?

15

Возьмите 5 платоновых тел из набора костей Dungeons & Dragons. Они состоят из 4-сторонних, 6-сторонних (обычных), 8-сторонних, 12-сторонних и 20-сторонних кубиков. Все начинаются с номера 1 и увеличиваются на 1 до их общего количества.

Скатайте их все сразу, возьмите их сумму (минимальная сумма 5, максимальная 50). Сделайте это несколько раз. Что такое распределение?

Очевидно, что они будут стремиться к нижнему пределу, так как число ниже, чем выше. Но будут ли заметные точки перегиба на каждой границе отдельного штампа?

[Редактировать: По-видимому, то, что казалось очевидным, не так. По словам одного из комментаторов, среднее значение составляет (5 + 50) /2 = 27,5. Я не ожидал этого. Я все еще хотел бы увидеть график.] [Edit2: имеет больше смысла видеть, что распределение n костей такое же, как и для каждого кубика в отдельности, сложенного вместе.]

Marcos
источник
1
Вы имеете в виду, каково распределение суммы дискретных униформ ? [1,4]+[1,6]+[1,8]+[1,12]+[1,20]
gung - Восстановить Монику
2
Один из способов проверить это - симуляция. В R: hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE))). Это фактически не стремится к низкому концу; из возможных значений от 5 до 50 среднее значение составляет 27,5, а распределение (визуально) не далеко от нормы.
Дэвид Робинсон
2
В моем наборе D & D есть d10, а также 5, о которых вы упомянули (плюс декадер, который, как я полагаю, вы не включили)
Glen_b
1
Вольфрам Альфа точно вычисляет ответ . Вот функция генерации вероятности , из которой вы можете непосредственно прочитать распределение. Кстати, этот вопрос является частным случаем вопроса, который был задан и полностью дан ответ на stats.stackexchange.com/q/3614 и stats.stackexchange.com/questions/116792 .
whuber
2
@AlecTeal: Полегче, крутой парень. Если бы вы провели исследование, вы бы увидели, что у меня не было компьютера, чтобы самому запустить симуляцию. И катание 100 раз, казалось, не столь эффективно для такого простого вопроса.
Маркос

Ответы:

18

Я не хотел бы делать это алгебраически, но вы можете вычислить pmf достаточно просто (это просто свертка, которая действительно проста в электронной таблице).

Я рассчитал это в электронной таблице *:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

Здесь - количество способов получения каждой суммы ; - вероятность, где . Наиболее вероятные результаты происходят менее чем в 5% случаев.i p ( i ) p ( i ) = n ( i ) / 46080n(i)ip(i)p(i)=n(i)/46080

Ось Y - это вероятность, выраженная в процентах. введите описание изображения здесь

* Метод, который я использовал, похож на процедуру, описанную здесь , хотя точная механика, участвующая в его настройке, меняется по мере изменения деталей пользовательского интерфейса (этому посту уже около 5 лет, хотя я обновил его около года назад). И на этот раз я использовал другой пакет (на этот раз я сделал это в Calc LibreOffice). Тем не менее, это суть этого.

Glen_b - Восстановить Монику
источник
Удивительно, я вообще не ожидал симметричного распределения. Я не уверен, почему моя интуиция была так далека.
Маркос
6
Сумма независимых симметричных случайных величин также симметрична по распределению.
Glen_b
Хорошее правило. Это где-то опубликовано?
Маркос
3
Да, но моя точка зрения была слишком тривиальной, чтобы заставить журнал публиковать ее, это было бы только заданием для студента. Вы можете использовать тот факт, что характеристическая функция случайной величины, которая симметрична относительно начала координат, является реальной и даже (факт, который вы можете найти, изложенный на странице википедии по характеристической функции ) - ну, и я думаю, вам нужна одна -to-one свойство cfs vs pmfs, либо используйте двойное отношение, чтобы установить, что четный cf также подразумевает симметричный pmf ...
Glen_b -Возвратите Монику
2
... и тот факт, что произведение четных функций является четным, но на самом деле это достаточно очевидно только из непосредственного рассмотрения того, как работает свертка - в свертке двух симметричных функций (в данном случае pmfs), для каждого члена в сумме у продуктов на одном конце есть соответствующий член того же размера на другом конце, симметрично размещенный вокруг центра.
Glen_b
7

Итак, я сделал этот код:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

Результатом является этот сюжет. введите описание изображения здесь

Это выглядит довольно гауссовски. Я думаю, что мы (снова), возможно, продемонстрировали изменение центральной предельной теоремы.

EngrStudent - Восстановить Монику
источник
2
Хм, самый низкий бросок в вашей симуляции равен 6. Вероятность его броска (или любого отдельного броска, сохраняя идентичность кубика) составляет 1: 4 * 1: 6 * 1: 8 * 1: 10 * 1: 12 * 1: 20 = 1: 460800. Мои процедуры потребовали бы размер выборки N как минимум вдвое (возможно, в 4 раза) этой суммы (например, предел Найквиста), чтобы выявить любые ошибки в моем моделировании.
Маркос
Мой опыт работы с Nyquist также говорит, что минимум в 4 раза. ... сделано. Если 2 миллиона недостаточно, дайте мне знать, что это должно быть.
EngrStudent - Восстановить Монику
3
n
1
@EngrStudent: Кстати, ваш результат не подтверждает CLT?
Маркос
1
@ theDoctor нет, он не подтверждает CLT по целому ряду причин
Glen_b
7

Небольшая помощь вашей интуиции:

Сначала рассмотрим, что произойдет, если вы добавите одну ко всем граням одного кубика, например, d4. Таким образом, вместо 1,2,3,4 лица теперь показывают 2,3,4,5.

Сравнивая эту ситуацию с оригиналом, легко увидеть, что общая сумма теперь на единицу больше, чем раньше. Это означает, что форма распределения неизменна, он просто перемещается на один шаг в сторону.

Теперь вычтите среднее значение каждого кубика со всех сторон этого кубика.

Это дает кости, отмеченные

  • 32121232
  • 523212123252
  • 7252321212325272

и т.п.

Теперь сумма этих костей должна иметь ту же форму, что и оригинал, только смещенная вниз. Должно быть понятно, что эта сумма симметрична относительно нуля. Поэтому исходное распределение также симметрично.

Стиг Хеммер
источник
4

п(Иксзнак равноя)знак равноп(я)
Икся0,1,...,N(0,1/6,1/6,1/6,1/6,1/6,1/6)п(T)знак равноΣ06п(я)TяQ(J)J0,1,...,мp(t)q(t)
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

и вы можете проверить, что это правильно (ручной расчет). Теперь для реального вопроса, пять кубиков с 4,6,8,12,20 сторонами. Я сделаю расчет, предполагая, что для каждого кубика одинаковые пробники. Потом:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

Сюжет показан ниже:

введите описание изображения здесь

Теперь вы можете сравнить это точное решение с моделированием.

Къетил б Халворсен
источник
1

Центральная предельная теорема отвечает на ваш вопрос. Хотя его детали и доказательства (и эта статья в Википедии) несколько сногсшибательны, суть этого проста. В Википедии говорится, что

сумма числа независимых и одинаково распределенных случайных величин с конечными дисперсиями будет стремиться к нормальному распределению по мере роста числа переменных.

Эскиз доказательства для вашего случая:

Когда вы говорите «бросить все кости одновременно», каждый бросок всех кубиков является случайной величиной.

На ваших кубиках напечатаны конечные числа. Таким образом, сумма их значений имеет конечную дисперсию.

Каждый раз, когда вы бросаете все кости, распределение вероятности исхода одинаково. (Кости не меняются между бросками.)

Если вы бросаете кубики честно, то каждый раз, когда вы их бросаете, результат будет независимым. (Предыдущие броски не влияют на будущие броски.)

Независимый? Проверьте. Идентично распределены? Проверьте. Конечная дисперсия? Проверьте. Поэтому сумма стремится к нормальному распределению.

Это даже не имело бы значения, если бы распределение для одного броска всех игральных костей было перекошено в сторону нижнего конца. Я бы не имел значения, были ли в этом дистрибутиве бугорки. Все суммирование сглаживает его и делает его симметричным гауссовским. Вам даже не нужно делать какую-либо алгебру или симуляцию, чтобы показать это! Это удивительное понимание CLT.

Пол Кантрелл
источник
3
Хотя CLT является релевантным, и, как показывают другие посты, распределения выглядят примерно как гауссовские, мы имеем дело только с суммой из 5 независимых неидентичных распределений. Так что пункт 1) 5 на самом деле недостаточно велик, чтобы вызвать теорему, которая применяется «на бесконечности». Пункт 2) вы не можете использовать ванильный CLt, потому что вещи, которые вы суммируете, не являются iid. Вам нужен CLT Ляпунова, я думаю.
Питер
2
Вам не нужна центральная предельная теорема, чтобы сказать, что сумма некоторых независимых случайных величин с распределениями, симметричными относительно их соответствующих центров, имеет симметричное распределение относительно суммы центров.
Генри
@Peter: Вам не хватает структуры моего доказательства. ОП говорит: «бросьте их все сразу». Я беру каждый бросок всех кубиков как одну случайную переменную. Эти случайные величины имеют одинаковое распределение. Не надо Ляпунова. Кроме того, OP говорит «делайте это несколько раз», что я понимаю как «в пределе», поэтому ваша точка № 1 недействительна. Мы не просто суммируем один бросок 5 кубиков здесь.
Пол Кантрелл
2
@PaulCantrell Каждый бросок всех кубиков - это сумма пяти независимых неидентично распределенных переменных. ОП спрашивает о распределении этой суммы. Вы можете сделать много бросков 5 кубиков, но это просто выборка из рассматриваемого распределения, никто не суммирует эти выборки.
Питер
1
@PaulCantrell Я думаю, это зависит от того, как вы интерпретируете «Делать это несколько раз». Сделайте это несколько раз, и они снова суммируются (получая одно значение), или сделайте это несколько раз и посмотрите на гистограмму этих выборок (получив несколько значений). Я взял последнюю интерпретацию.
Питер