Если у меня есть случайные величины , которые распределены по Пуассону с параметрами , каково распределение (т. Целое число среднего значения)?λ 1 , λ 2 , … , λ n Y = ⌊ ∑ n i = 1 X i
Сумма Пуассона - это тоже Пуассон, но я недостаточно уверен в статистике, чтобы определить, является ли она такой же для случая выше.
poisson-distribution
average
Любо Антонов
источник
источник
Ответы:
Обобщение вопроса требует распределенияY=⌊X/m⌋ когда распределение X известно и поддерживается на натуральных числах. (В вопросе X имеет пуассоновское распределение параметра λ=λ1+λ2+⋯+λn и m=n .)
РаспределениеY легко определяется распределением mY , вероятность которого производящая функция (PGF) может быть определена в терминах PGF из X . Вот схема деривации.
Напишите для pgf из , где (по определению) . построен из таким образом, что его pgf, ,X p n = Pr ( X = n ) m Y X qp(x)=p0+p1x+⋯+pnxn+⋯ X pn=Pr(X=n) mY X q
Потому что это сходится абсолютно для , мы можем переставить слагаемые в сумму частей вида| х | ≤ 1
для . В степенной ряд функции состоят из любого срок серии , начиная с : это иногда называют прореживания из . Поиски в Google в настоящее время не дают много полезной информации о децимациях, поэтому для полноты приведем формулу.x t D m , t p m th p t th pt = 0 , 1 , … , м - 1 ИксTDм , тп мго п Tго п
Пусть будет любым примитивным корнем единства; например, взять . Тогда из и чтоm th ω = exp ( 2 i π / m ) ω m = 1 ∑ m - 1 j = 0 ω j = 0ω мго ω = exp( 2 я π/ м) ωм= 1 Σм - 1J = 0ωJ= 0
Чтобы увидеть это, обратите внимание, что оператор является линейным, поэтому достаточно проверить формулу на основе . Применение правой части к дает { 1 , x , x 2 , … , x n , … } x nИксTDм , т { 1 , х , х2, … , ХN, ... } ИксN
Когда и отличаются кратным , каждый член в сумме равен и мы получаем . В противном случае члены циклически перебирают степени и они суммируются до нуля. Откуда этот оператор сохраняет все степени совпадающие с по модулю и убивает все остальные: это именно требуемая проекция.н м 1 х н ω т - н х т мt n m 1 xn ωt−n x t m
Формула для легко следует, изменив порядок суммирования и признав одну из сумм геометрической, записав ее в замкнутой форме:q
Например, pgf распределения Пуассона параметра имеет вид . С , и PGF из будетp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλ p(x)=exp(λ(x−1)) m=2 ω=−1 2Y
Одним из применений этого подхода является вычисление моментов и . Значение производной от pgf, оцененного при является факториальным моментом. момент является линейной комбинацией первых факторных моментов. Используя эти наблюдения, мы находим, например, что для пуассоновского распределенного его среднее значение (которое является первым факториальным моментом) равно , среднее равно , а среднее значение равноm Y k th x = 1 k th k th k X λ 2 ⌊ ( X / 2 ) ⌋ λ - 1X mY kth x=1 kth kth k X λ 2⌊(X/2)⌋ 3⌊(X/3)⌋λ-1+e-3λ/2(sin ( √λ−12+12e−2λ 3⌊(X/3)⌋ λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
Средние значения для показаны синим, красным и желтым соответственно как функции от : асимптотически среднее значение падает на по сравнению с исходным средним Пуассона.λ ( m - 1 ) / 2m=1,2,3 λ (m−1)/2
Аналогичные формулы для дисперсий могут быть получены. (Они становятся беспорядочными по мере подъема и поэтому опускаются. Одна вещь, которую они окончательно устанавливают, это то, что когда кратное не кратно Пуассону: оно не имеет характерного равенства среднего значения и дисперсии) Вот график дисперсий как функция для :m > 1 Y λ m = 1 , 2 , 3m m>1 Y λ m=1,2,3
Интересно, что при больших значениях дисперсии увеличиваются . Интуитивно это объясняется двумя конкурирующими явлениями: функция пола эффективно объединяет группы значений, которые изначально были различны; это должно привести к уменьшению дисперсии . В то же время, как мы уже видели, средства тоже меняются (потому что каждая ячейка представлена наименьшим значением); это должно привести к тому, что термин, равный квадрату разности средств, будет добавлен обратно. Увеличение дисперсии для больших становится больше с большими значениями .λ mλ λ m
Поведение дисперсии с на удивление сложное. Давайте закончим быстрой симуляцией (в ), показывающей, на что она способна. Графики показывают разницу между дисперсией и дисперсией для пуассоновского распределенного с различными значениями диапазоне от до . Во всех случаях графики, похоже, достигли своих асимптотических значений справа.m m ⌊ X / m ⌋ X X λ 1 5000mY m m⌊X/m⌋ X X λ 1 5000
R
источник
sapply()
для симуляции. Благодарю.Как говорит Майкл Черник, если отдельные случайные величины независимы, то сумма равна Пуассону с параметром (среднее и дисперсия) который вы могли бы назвать . λ∑ni=1λi λ
Деление на уменьшает среднее значение до и дисперсию поэтому дисперсия будет меньше эквивалентного распределения Пуассона. Как говорит Майкл, не все значения будут целыми числами.λ / n λ / n 2n λ/n λ/n2
Использование функции floor немного уменьшает среднее значение, примерно на , и слегка влияет на дисперсию, хотя и более сложным образом. Несмотря на то, что у вас есть целочисленные значения, дисперсия все равно будет существенно меньше, чем среднее значение, и поэтому у вас будет более узкое распределение, чем у Пуассона.12−12n
источник
Массовая функция вероятности среднего от независимых пуассоновских случайных величин может быть записана явно, хотя ответ может вам не сильно помочь. Как отметил в своих комментариях Михаил Черник, сумма независимых пуассоновских случайных величин с соответствующими параметрами является пуассоновской случайной величиной с параметром . Следовательно, Таким образом, - случайная величина, принимающая значение с вероятностью∑ i X i X i λ i λ = ∑ i λ i P { n ∑ i = 1 X i = k } = exp ( - λ ) λ kn ∑iXi Xi λi λ=∑iλi Y =п-1Σ п я = 1 Xяк/пехр(-λ)λк
источник
У не будет Пуассона. Обратите внимание, что случайные переменные Пуассона принимают неотрицательные целочисленные значения. После деления на константу вы создаете случайную переменную, которая может иметь нецелые значения. Он по-прежнему будет иметь форму Пуассона. Просто дискретные вероятности могут возникать в нецелых точках.
источник