Сумма коэффициентов полиномиального распределения

10

Я бросаю честный кубик. Всякий раз, когда я получаю 1, 2 или 3, я записываю «1»; всякий раз, когда я получаю 4, я записываю '2'; всякий раз, когда я получаю 5 или 6, я записываю «3».

Пусть будет общим количеством бросков, которое мне нужно, чтобы произведение всех чисел, которые я записал, было . Я хочу вычислить (или приблизительный) , и приближение может быть дано как функция нормального распределения.N100000P(N25)

Во-первых, я знаю, что потому что \ log_3 100.000 \ приблизительно 10.48 . Теперь пусть a , b и c - количество раз, которое я записал 1, 2 и 3 соответственно. Затем:P(N11)=1log3100.00010.48abc

P(a,b,cn)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise

То, что я хочу рассчитать, это:

P(a+b+c252b3c100000)

Как мне рассчитать это?

--РЕДАКТИРОВАТЬ:

Поэтому было предложено заменить это условие на:

P(a+b+c25αa+βb+γcδ)

где , , и .β = log 2 γ = log 3 δ = log 100000α=0β=log2γ=log3δ=log100000

Это выглядит более разрешимым! Я, к сожалению, до сих пор не знаю, как это решить.

Педро Карвалью
источник
2
+1 Эта проблема может показаться немного более знакомой и более подходящей для более приближенных решений, если вы напишите условие в форме где и . α = 0 , β = log ( 2 ) , γ = log ( 3 ) , δ = log ( 100000 )αa+βb+γcδα=0,β=log(2),γ=log(3),δ=log(100000)
whuber
Я добавил этот новый способ написания условия, но, к сожалению, до сих пор не имею ни малейшего понятия, как это решить!
Педро Карвалью
Еще один намек на то, что если есть вхождений '2', вы остановитесь. Таким образом, вы можете аппроксимировать это отрицательным биномом с параметрами и (также с и ). Точный ответ также выполним, так как комбинаций не так много. Кроме того, условие не является точным - необходимо указать, что «2» или «3» были записаны в й бросок17 0,5 11 1 / 3 Н17170.5111/3N
вероятностная

Ответы:

1

Настоящий вопрос представляет собой особый случай, когда вы имеете дело с величиной, которая является линейной функцией полиномиальной случайной величины. Можно точно решить вашу проблему, перечислив полиномиальные комбинации, которые удовлетворяют требуемому неравенству, и суммируя распределение по этому диапазону. В случае, когда велико, это может стать невозможным в вычислительном отношении. В этом случае можно получить приближенное распределение, используя нормальное приближение к многочлену. Обобщенная версия этого приближения показана ниже, а затем применяется к вашему конкретному примеру.N


Задача общего приближения. Предположим, у нас есть последовательность заменяемых случайных величин с диапазоном . Для любого мы можем сформировать вектор счета , который подсчитывает число вхождения каждого исхода в первые значений последовательности. Поскольку базовая последовательность является заменяемой, вектор счета распределяется как:n N X X ( n ) ( X 1 , X 21,2,...,mnNпXX(n)(X1,X2,...,Xm)n

X ~ Mu(n,θ)θ=limnX(n)/n.

Теперь предположим, что у нас есть некоторый вектор неотрицательных весов и мы используем эти веса для определения линейной функции:w=(w1,w2,...,wm)

A(n)i=1mwiXi.

Поскольку веса неотрицательны, эта новая величина не уменьшается по . Затем мы определяем число , которое является наименьшим числом наблюдений, необходимых для получения определенного минимального значения для нашей линейной функции. Мы хотим приблизить распределение в случае, когда это значение (стохастически) велико.N ( a ) min { n N | A ( n ) a }nN(a)min{nN|A(n)a}N(a)


Решение проблемы общей аппроксимации. Во-первых, отметим, что, поскольку не уменьшается по (что верно, поскольку мы предположили, что все веса неотрицательны), имеем:nA(n)n

P(N(a)n)=P(N(a)>n1)=P(A(n1)<a).

Следовательно, распределение непосредственно связано с распределением . Предполагая, что первая величина велика, мы можем приблизить распределение последней, заменив дискретный случайный вектор непрерывным приближением из многомерного нормального распределения. Это приводит к нормальному приближению для линейного количества , и мы можем непосредственно вычислить моменты этой величины. Для этого мы используем тот факт, что , и для . С некоторой базовой алгеброй это дает нам:Х ( п ) Е ( Х я ) = п θ я В ( Х я ) = п θ я ( 1 - θ я ) С ( Х я , Х J ) = - п θ я θ J я JNAXA(n)E(Xi)=nθiV(Xi)=nθi(1θi)C(Xi,Xj)=nθiθjij

μE(1nA(n))=i=1mwiθi,

σ2V(1nA(n))=i=1mwiθi(i=1mwiθi)2=μ(1μ).

Принятие нормального приближения к полиному дает теперь приблизительное распределение . Применение этого приближения дает:A(n) ~ N(nμ,nμ(1μ))

P(N(a)n)=P(A(n1)<a)Φ(a(n1)μ(n1)μ(1μ)).

(Символ является стандартным обозначением для стандартной функции нормального распределения.) Можно применить это приближение, чтобы найти вероятности, относящиеся к величине для заданного значения . Это базовое приближение, которое не пыталось включить коррекцию непрерывности на значения базовых значений многочленного счета. Его получают, взяв нормальное приближение, используя те же первые два центральных момента, что и точную линейную функцию.N ( a ) aΦN(a)a


Применение к вашей проблеме: в вашей задаче у вас есть вероятности , веса и предельное значение . Поэтому у вас есть (округление до шести десятичных знаков) . Применяя вышеприведенное приближение, мы имеем (округление до шести десятичных знаков):w=(0,ln2,ln3)a=ln100000μ=1θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729

P(N(a)25)Φ(ln100000240.481729240.499666)=Φ(0.019838)=0.492086.

Используя точное полиномиальное распределение, суммируя по всем комбинациям, удовлетворяющим требованию , можно показать, что точный результат равен . Следовательно, мы можем видеть, что приближение довольно близко к точному ответу в данном случае.Р ( Н ( ) 25 ) = 0,483500P(A(24)<a)P(N(a)25)=0.483500

Надеемся, что этот ответ даст вам ответ на ваш конкретный вопрос, а также поместит его в более общие рамки вероятностных результатов, которые применяются к линейным функциям полиномиальных случайных векторов. Настоящий метод должен позволить вам получить приблизительные решения проблем общего типа, с которыми вы сталкиваетесь, с учетом изменения конкретных чисел в вашем примере.

Бен - Восстановить Монику
источник
0

Давайте сделаем нормальное приближение.

Во-первых, давайте полностью перефразируем вашу проблему в журналах. Вы начинаете с 0 в момент времени t = 0. Затем на каждом временном шаге вы добавляете:

  • 0 с вероятностью 1/2

  • log(2) с вероятностью 1/6

  • log(3) с вероятностью 1/3

Вы останавливаете этот процесс, когда ваша сумма превышает в этот момент вы смотрите, сколько бросков вы сделали. Количество бросков, которое потребовалось вам, чтобы достичь этой точки, равно ^Nlog(105)N

Мой калькулятор сообщает мне, что среднее значение ваших приращений составляет: а дисперсия . Для справки, конечная точка находится на отметке поэтому мы доберемся до него примерно за 24 шага.0,25 11,510.480.2511.51

При условии, что мы сделали 25 шагов, распределение суммы примерно равно гауссову с центром в 12,0 и с дисперсией 6,25. Это дает нам грубое гауссовское приближениеp(N25)0.5

Вам нужно взглянуть на кумулянты суммы при N = 25, чтобы узнать, является ли гауссовское приближение нормальным. Учитывая, что приращения не симметричны, приближение может быть не лучшим

Гийом Дехене
источник
1
Можете ли вы завершить вывод для меня? Мне трудно это увидеть. Кроме того, нет точного способа рассчитать его?
Педро Карвалью
1
Разве вы не имеете в виду «log (2)» и «log (3)», где у вас есть log (1) и log (2)?
Glen_b
@GuillaumeDehaene писал: .... По моим расчетам, что сильно отличается от 0,5P ( N 25 ) = 1 - P ( N 24 ) = 1 - 1127291856633071p(N25)0.5P(N25)=1P(N24)=1112729185663307164998372267786240.8266
волки
как вы получаете P (n \ leq24) \ около 0,18?
Гийом Дехен