Как мы можем получить нормальное распределение как если диапазон значений нашей случайной величины ограничен?

12

Допустим, у нас есть случайная величина с диапазоном значений, ограниченных a и b , где a - минимальное значение, а b - максимальное значение.

Мне сказали , что в n , где n нашего размера выборки, распределение выборки по средствам выборки является нормальным распределением. То есть, как мы увеличиваем n мы становимся ближе и ближе к нормальному распределению, но фактический предел при n является равным для нормального распределения.

Однако не является ли это частью определения нормального распределения, которое оно должно расширять от до ?

Если максимум нашего диапазона равен b , то максимальное среднее значение выборки (независимо от размера выборки) будет равно b , а минимальное среднее значение выборки равно a .

Поэтому мне кажется, что даже если мы возьмем предел, когда приближается к бесконечности, наше распределение не является фактическим нормальным распределением, поскольку оно ограничено и .бnab

Что мне не хватает ?

Джереми Рэдклифф
источник

Ответы:

15

Вот что вам не хватает. Асимптотическое распределение является не (образец среднего), но , где является средним .X¯nθXn(X¯nθ)θX

Пусть это случайные переменные, для которых и имеют среднее значение и дисперсию . Таким образом, имеет ограниченную поддержку. CLT сообщает, что a < X i < b X i θ σ 2 X i X1,X2,a<Xi<bXiθσ2Xi

n(X¯nθ)dN(0,σ2),

где - среднее значение выборки. СейчасX¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

При нижняя граница и верхняя граница стремятся к и соответственно, и, таким образом, при поддержка это именно вся настоящая линия.- n nnn(X¯nθ)

Всякий раз, когда мы используем CLT на практике, мы говорим , и это всегда будет приближением.X¯nN(θ,σ2/n)


РЕДАКТИРОВАТЬ: Я думаю, что часть путаницы от неправильного толкования центральной предельной теоремы. Вы правы, что выборочное распределение среднего значения выборки равно

X¯nN(θ,σ2/n).

Однако распределение выборки является конечным свойством выборки. Как вы сказали, мы хотим, чтобы ; как только мы сделаем это, знак будет точным результатом. Однако, если мы допустим , у нас больше не будет в правой части (так как теперь ). Поэтому следующее утверждение неверноn n n ˉ X n d N ( θ , σ 2 / n )  при  n .nnnn

X¯ndN(θ,σ2/n) as n.

Здесь означает сходимость с точки зрения распределения. Мы хотим точно записать результат, чтобы не было справа. Здесь мы теперь используем свойства случайных величин, чтобы получить нdn

n(X¯nθ)dN(0,σ2)

Чтобы увидеть, как работает алгебра, посмотрите ответ здесь .

Greenparker
источник
Спасибо. Я понимаю вашу алгебру неравенства, но у меня все еще есть некоторая путаница в отношении вашего первого абзаца: «Асимптотическое распределение имеет не (среднее значение выборки), а ... ". Я думал, что CLT сказал, что выборочное распределение выборки означает, что приближается к нормальному распределению как , и я думал, что - это RV, который принимает все возможные значения выборок размера . Откуда берется ? Почему нас интересует это распределение, а не распространение ? X¯nn(X¯nθ)nX¯nnn(X¯nθ)X¯n
Джереми Рэдклифф
(продолжение) Это касается нормализации распределения выборочных средств? Это откуда квадратный корень? Это связано с баллами? Z
Джереми Рэдклифф
@jeremyradcliff Я отредактировал свой ответ и включил ссылку, которая объясняет некоторые детали. Надеюсь, теперь это имеет больше смысла.
Greenparker
1
Большое спасибо, что нашли время для редактирования, ссылка, которую вы предоставили, именно то, что я искал. И вы правы, проблема была в том, что у меня были проблемы с согласованием конечного характера распределения выборки и того факта, что мы принимаем в . n
Джереми Рэдклифф
7

Если вы имеете в виду центральную предельную теорему, обратите внимание, что один правильный способ записать это

(x¯μσ)ndN(0,1)

при нормальных условиях ( - среднее значение и стандартное отклонение ).x iμ,σxi

С помощью этого формального определения вы сразу увидите, что левая часть может принимать значения для любого конечного диапазона при достаточно большом .n

Для помощи подключения к для неформальной идеи , что «среднее приближается к нормальному распределению при большом », мы должны понимать , что «приближается к нормальному распределению» означает , что прибудет ВПР в сколь угодно близко к более нормальному распределению , как становится большим. Но по мере того как становится большим, стандартное отклонение этого приближенного распределения уменьшается, поэтому вероятность экстремального хвоста аппроксимирующей нормали также становится равной 0.н н нnnn

Например, предположим, что . Тогда вы можете использовать неформальное приближение, чтобы сказать, чтоXiBern(p=0.5)

X¯˙N(p,p(1p)n)

Так что, хотя это верно, что для любого конечного ,n

P(N(p,p(1p)n)<0)>0

(подразумевается, что аппроксимация явно никогда не бывает идеальной), так как ,n

P(N(p,p(1p)n)<0)0

Так что расхождение между фактическим распределением и приблизительным распределением будет исчезать, как должно произойти с приближениями.

Клифф AB
источник