Ошибка в нормальном приближении к равномерному распределению суммы

20

Один наивный метод для аппроксимации нормального распределения состоит в том, чтобы сложить, возможно, 100 случайных величин IID, равномерно распределенных по [0,1] , затем пересчитать их и изменить масштаб, полагаясь на Центральную предельную теорему. ( Примечание : существуют более точные методы, такие как преобразование Бокса – Мюллера .) Сумма IID U(0,1)случайных величин ( 0 , 1 ) известна как равномерное распределение суммы или распределениеИрвина-Холла.

Насколько велика ошибка в приближении равномерного распределения суммы нормальным распределением?

Всякий раз, когда этот тип вопроса подходит для аппроксимации суммы случайных величин IID, люди (включая меня) поднимают теорему Берри – Эссеена , которая является эффективной версией центральной теоремы о пределе, учитывая, что существует третий момент:

|Fn(x)Φ(x)|Cρσ3n

где Fn - кумулятивная функция распределения для пересчитанной суммы n случайных величин IID, ρ - абсолютный третий центральный момент E|(XEX)3|, σ представляет собой стандартное отклонение, а C является абсолютной константой , которая может быть принята равной 1 или даже 1/2 .

Это неудовлетворительно. Мне кажется, что оценка Берри – Эссеена наиболее близка к точной на биномиальных распределениях, которые являются дискретными, с наибольшей ошибкой при для симметричного биномиального распределения. Самая большая ошибка происходит при самом большом прыжке. Однако равномерное распределение суммы не имеет скачков.0

Численные тесты показывают, что ошибка уменьшается быстрее, чем c/n .

Используя , оценка Берри-Эссеена является | F n ( x ) - Φ ( x ) | 1C=1/2

|Fn(x)Φ(x)|121321123n0.650n

что для составляет около 0,205 , 0,145 и 0,103 соответственно. Фактические максимальные различия для n = 10 , 20 , 40, по- видимому, составляют около 0,00281 , 0,00139 и 0,000692 , соответственно, которые намного меньше и, по-видимому, уменьшаются как c / n вместо c / n=10,20,400.2050.1450.103n=10,20,400.002810.001390.000692c/n .c/n

Дуглас Заре
источник
7
Если вы расширите распределение суммы в разложении Эджворта , вы обнаружите, что равномерно по x при n (так как равномерное распределение симметрично), поэтому c / n звучит примерно так. Из-за o ( n - 1 )Fn(x)=Φ(x)+n1g(x)+o(n1)xnc/no(n1) термина , это не дает вам границы, хотя ...
MånsT
1
Спасибо, похоже, это объясняет шаблон для многих других дистрибутивов. c/n
Дуглас Заре

Ответы:

17

Пусть будут U ( - b , b ) случайными величинами и рассмотрим нормированную сумму S n = U1,U2,U(b,b) И связанныйним SUP нормой δ п = вир х R | F n ( x ) - Φ ( x ) |

Sn=3i=1nUibn,
sup
δn=supxR|Fn(x)Φ(x)|,
FnSn .

δn

δn<17.5πn+1π(2π)n+12π3nexp(π2n/24).

Proof. See J. V. Uspensky (1937), Introduction to mathematical probability, New York: McGraw-Hill, p. 305.

This was later improved by R. Sherman to the following.

Lemma 2 (Sherman): The following improvement on the Uspensky bound holds.

δn<17.5πn(π180+17.5πn)eπ2n/24+1(n+1)π(2π)n+12π3neπ2n/24.

Proof: See R. Sherman, Error of the normal approximation to the sum of N random variables, Biometrika, vol. 58, no. 2, 396–398.

The proof is a pretty straightforward application of the triangle inequality and classical bounds on the tail of the normal distribution and on (sinx)/x applied to the characteristic functions of each of the two distributions.

cardinal
источник
2
+1 Is N=n in Lemma 2?
@Procrastinator: Good catch.
cardinal
1
Thanks! Those references are very helpful. The estimates seem to be within a factor of 2 of the actual value.
Дуглас Заре