Сходится ли нормальное распределение к определенному, если стандартное отклонение растет без границ? мне кажется, что pdf начинает выглядеть как равномерное распределение с границами, заданными . Это правда?
normal-distribution
convergence
Рамон Мартинес
источник
источник
Ответы:
Другие ответы, уже здесь, делают большую работу по объяснению, почему гауссовые RV не сходятся ни к чему, когда дисперсия увеличивается без границ, но я хочу указать на, казалось бы, однородное свойство, которое удовлетворяет такая группа гауссиан , что, я думаю, могло бы достаточно, чтобы кто-то догадался, что они становятся единообразными, но оказывается, что он недостаточно силен, чтобы сделать вывод.
Рассмотрим набор случайных величин{X1,X2,…} где Xn∼N(0,n2) . Пусть A=[a1,a2] - фиксированный интервал конечной длины, и для некоторого c∈R определим B=A+c , т. Е. B есть A но просто смещено на c . Для интервала I=[i1,i2] определите len(I)=i2−i1 как длину I и обратите внимание, что len(A)=len(B) .
Сейчас я докажу следующий результат:
Результат :|P(Xn∈A)−P(xn∈B)|→0 при n→∞ .
Я называю это однородным, потому что он говорит, что распределение все чаще имеет два фиксированных интервала одинаковой длины с одинаковой вероятностью, независимо от того, насколько далеко они могут быть друг от друга. Это определенно очень однородная особенность, но, как мы увидим, это ничего не говорит о фактическом распределении сходящемся к однородному.Xn Xn
Pf: обратите внимание, что где поэтому Я могу использовать (очень грубую) оценку, что чтобы получитьXn=nX1 X1∼N(0,1)
Я могу сделать то же самое для чтобы получитьB
Собрав их вместе, я имею при (здесь я использую неравенство треугольника).
Чем это отличается от сходящегося в равномерном распределении? Я только что доказал, что вероятности, заданные для любых двух фиксированных интервалов одной и той же конечной длины, становятся все ближе и ближе, и это интуитивно понятно, так как плотности «сглаживаются» с точки зрения иXn A B
Но для того, чтобы сходился в равномерном распределении, мне нужно, чтобы направлялся к пропорции для любого интервала , и это совсем другое дело, потому что это должно применяться к любому , а не только к одному фиксированному заранее (и, как уже упоминалось, это также невозможно даже для дистрибутива с неограниченной поддержкой).Xn P(Xn∈I) len(I) I I
источник
Распространенная ошибка в вероятности - думать, что распределение однородно, потому что оно выглядит визуально плоским, когда все его значения близки к нулю. Это связано с тем, что мы склонны видеть, что и, тем не менее, , то есть небольшой интервал вокруг в 1000 раз больше вероятно, чем небольшой интервал вокруг .f(x)=0.001≈0.000001=f(y) f(x)/f(y)=0.001/0.000001=1000 x y
Он определенно не является равномерным по всей реальной линии в пределе, так как нет равномерного распределения по . На даже не приблизительно одинаков .(−∞,∞) [−2σ,2σ]
Последнее видно из правила 68-95-99.7, с которым вы, похоже, знакомы. Если бы он был приблизительно одинаковым для , то вероятность нахождения в и должна быть одинаковой, так как два интервала одинаковы длина. Но это не тот случай: , но .[−2σ,2σ] [0,σ] [σ,2σ] P([0,σ])≈0.68/2=0.34 P([σ,2σ])≈(0.95−0.68)/2=0.135
При просмотре по всей реальной линии эта последовательность нормальных распределений не сходится ни к какому распределению вероятности. Есть несколько способов увидеть это. Например, cdf нормали со стандартным отклонением имеет вид и для всех , что не является cdf для любой случайной величины. На самом деле это вообще не cdf.σ Fσ(x)=(1/2)(1+erf(x/2–√σ) limσ→∞Fσ(x)=1/2 x
Причиной этой не сходимости сводится к «потере массы» является предел. Ограничивающая функция нормального распределения фактически «потеряла» вероятность (т.е. она улетела в бесконечность). Это связано с концепцией строгости мер , которая дает необходимые условия для последовательности случайных переменных сходиться к другой случайной переменной.
источник
Ваше утверждение, что pdf начинает выглядеть как равномерное распределение с границами, заданными[−2σ,2σ] неверно, если вы настроите для соответствия более широкому стандартному отклонению.σ
Рассмотрим эту диаграмму двух нормальных плотностей с центром в нуле. Красная кривая соответствует стандартному отклонению а синяя кривая - стандартному отклонению , и это действительно тот случай, когда синяя кривая почти плоская на1 10 [−2,2]
но для синей кривой с мы должны смотреть на ее форму на . Изменение масштаба по осям и по коэффициентам дает следующий график, и вы получаете точно такую же форму для плотности синего цвета на этом более позднем графике, что и плотность красного цвета на предыдущем графикеσ=10 [−20,20] x y 10
источник
Ваш вопрос в корне ошибочный. Стандартное нормальное распределение масштабируется таким образом , что . Таким образом, для некоторого другого распределения Гаусса ( ) тогда кривая между границами имеет ту же форму, что и стандартное нормальное распределение. Единственная разница - коэффициент масштабирования. Так что если вы масштабируете гауссиану путем деления на , то вы получите стандартное нормальное распределение.σ=1 μ=0,σ=σ∗ [−2σ∗,2σ∗] σ∗
Теперь, если у вас есть распределение Гаусса ( ), тогда yes as , область между становится все более плоской.μ=0,σ=σ∗ σ∗→∞ [−2,2]
источник