Здесь, в Википедии, написано:
Для достаточно больших значений (скажем, ) нормальное распределение со средним и дисперсией (стандартное отклонение ) является отличным приближением к распределению Пуассона. Если больше, чем приблизительно 10, то нормальное распределение является хорошим приближением, если выполняется соответствующая коррекция непрерывности, то есть где (нижний регистр) является неотрицательным целым числом, заменяется на
К сожалению, это не цитируется. Я хочу быть в состоянии показать / доказать это с некоторой строгостью. Как вы можете на самом деле сказать, что нормальное распределение является хорошим приближением, когда , как вы оцениваете это «превосходное» приближение, какие меры использовались?
Самое большее, что у меня есть, это то, что здесь Джон говорит об использовании теоремы Берри-Эссеена и аппроксимирует ошибку в двух CDF. Из того, что я вижу, он не пробует никаких значений .
Ответы:
Предположим, что пуассоновский с параметром , а нормальный со средним и дисперсией . Мне кажется, что подходящим сравнением является и . Здесь для простоты я пишу , то есть нас интересует, когда соответствует стандартным отклонениям от среднего значения.X λ Y λ Pr ( Y ∈ [ n - 1Pr(X=n) n=λ+α√Pr(Y∈[n−12,n+12]) nαn=λ+αλ−−√ n α
Так что я обманул. Я использовал Mathematica. Таким образом, и и асимптотически as . Но их различие асимптотично If Вы изображаете это как функцию от , вы получите ту же кривую, что показана на рисунке со второго по последний в http://www.johndcook.com/blog/normal_approx_to_poisson/ .Pr ( Y ∈ [ n - 1Pr(X=n) 1Pr(Y∈[n−12,n+12]) А→∞& alpha(& alpha2-3)е-& alpha2/2
Вот команды, которые я использовал:
Также, немного поэкспериментировав, мне кажется, что лучшим асимптотическим приближением к является . Тогда ошибка что примерно в раза меньше.Pr(X=n) Pr(Y∈[n−α2/6,n+1−α2/6])
источник
Glen_b верен в том смысле, что «хорошая подгонка» является очень субъективным понятием. Однако, если вы хотите проверить, что ваше распределение Пуассона достаточно нормальное, вы можете использовать гипотетический тест Колморгова-Смирнова с нулевой гипотезой CDF пришел из распределения , предполагая ваш образец прибудет из пуассона ( ). Поскольку вы на самом деле не тестируете выборку, а один дистрибутив против другого, вам необходимо тщательно продумать размер выборки и уровень значимости, которые вы принимаете для этого гипотетического теста (поскольку мы не используем тест KS в обычном режиме). Это:H0: N(λ,λ) λ
Теперь вычислите частоту ошибок типа II для этого теста, исходя из того, что ваши данные действительно получены из пуассона ( ). Ваша степень соответствия нормальному распределению будет равна частоте ошибок Типа II, в том смысле, что выборки размера n из вашего конкретного распределения Пуассона будут в среднем приниматься % времени с помощью теста нормальности KS на выбранном вами уровне. уровень значимости.λ β
Во всяком случае, это всего лишь один из способов получить чувство "хорошей формы". Тем не менее, все полагаются на некоторые субъективные понятия «благости», которые вам придется определить для себя.
источник
Вывод из биномиального распределения может дать вам некоторое представление.
У нас есть биномиальная случайная величина;
Альтернативно это может быть вычислено рекурсивно;
Если вы соблюдаете начальные условия;
Теперь давайте предположим, что велико, а мало, но средний успех постоянен . Тогда мы можем сделать следующее;n p p(x) (np=λ)
Мы используем это .p=λ/n
Мы переключаем некоторые переменные и оцениваем;
Из исчисления мы знаем, что . Мы также знаем, что потому что и верх, и низ являются полиномами степени .limn→∞(1+x/n)n=ex [n(n−1)(n−2)⋯(n−i+1)]/ni≈1 i
Это приводит к выводу, что при :n→∞
Затем вы можете проверить, что и через определение. Мы знаем, что биномиальное распределение аппроксимирует нормальное в условиях теоремы де Мойвра-Лапласа, пока вы исправляете непрерывность, поэтому заменяется на ,E(X)=λ Var(X)=λ P ( X ≤ x ) P ( X ≤ x + 0,5 )P(X≤x) P(X≤x+0.5)
источник