Почему исправление непрерывности (скажем, нормальное приближение к биномиальному распределению) работает?

24

Я хотел бы лучше понять, как была получена поправка непрерывности к биномиальному распределению для нормального приближения.

Какой метод использовался, чтобы решить, что мы должны добавить 1/2 (почему не другое число?). Любое объяснение (или ссылка на предлагаемое чтение, кроме этого , будет оценено).

Таль Галили
источник

Ответы:

29
  1. На самом деле это не всегда «работает» (в смысле всегда улучшается приближение биномиального cdf нормалью при любом Икс ). Если биномиальное значение п равно 0,5, я думаю, что это всегда помогает, за исключением, возможно, самого крайнего хвоста. Если п не слишком далеко от 0,5, то при достаточно большом N оно обычно работает очень хорошо, за исключением дальнего хвоста, но если п близко к 0 или 1, это может вообще не помочь (см. Пункт 6 ниже)

  2. Следует помнить одну вещь (несмотря на то, что рисунки почти всегда содержат pmfs и pdfs), это то, что мы пытаемся приблизиться к cdf. Может быть полезно обдумать, что происходит с cdf бинома и аппроксимирующей нормалью (например, здесь ):Nзнак равно20,пзнак равно0,5

    введите описание изображения здесь

    В пределе cdf стандартизированного бинома перейдет к стандартной нормали (обратите внимание, что стандартизация влияет на шкалу по оси x, но не по оси y); на пути к все большему скачки биномиального cdf имеют тенденцию к более равномерному распределению по сравнению с нормальным cdf.N

    Давайте увеличим и посмотрим на это в приведенном выше простом примере:

    введите описание изображения здесь

    Обратите внимание, что, поскольку аппроксимирующая нормаль проходит близко к середине вертикальных скачков *, тогда как в пределе норма cdf локально приблизительно линейна и (как и прогрессия биномиального cdf вверху каждого скачка); в результате cdf имеет тенденцию пересекать горизонтальные шаги около . Если вы хотите приблизить значение бинома cdf,F(x)в целое числоx, то нормальный cdf достигает этой высоты вблизиx+1Икс+12F(Икс)Икс .Икс+12

    * Если мы применим Берри-Эссеена к переменным Бернулли с поправкой на среднее значение, границы Берри-Эссеена дают очень мало места для маневра, когда близко к 1п иxоколоμ- нормальный cdf должен проходить достаточно близко к середине скачков, потому что в противном случае абсолютная разница в cdf превысит лучшую оценку Берри-Эссена с одной или другой стороны. Это в свою очередь относится к тому, как далеко отх+112Иксμ нормальный cdf может пересекать горизонтальную часть шаг-функции биномиального cdf.Икс+12

  3. п(Иксзнак равноК)Nзнак равно20,пзнак равно0,5,Кзнак равно9N(10,(5)2)

введите описание изображения здесь

  1. п(Икс)Иксп(Икс)

    ! [введите описание изображения здесь

    Икс-12Икс+1212

    Можно алгебраически мотивировать этот подход, используя вывод (по аналогии с де Мойвром - см. Здесь или здесь, например), чтобы получить нормальное приближение (хотя это может быть выполнено несколько более непосредственно, чем подход Де Мойвра).

    (NИкс)журнал(1+Икс)Икс-Икс2/2

    п(Иксзнак равноИкс)12πNп(1-п)ехр(-(Икс-Nп)22Nп(1-п))

    μзнак равноNпσ2знак равноNп(1-п)ИксИкс

    Y~N(Nп,Nп(1-п))F(Y+12)-F(Y-12)знак равноY-12Y+12еY(U)dUеY(Y)еY(Икс)п(Иксзнак равноИкс)п(Иксзнак равноИкс)F(Икс+12)-F(Икс-12)

    [Подобное приближение типа «правила средней точки» может быть использовано для мотивации других таких приближений непрерывных pmfs плотностями с использованием поправки на непрерывность, но всегда следует быть осторожным, чтобы обратить внимание на то, где имеет смысл вызывать это приближение]

  2. Историческая справка: исправление преемственности, по-видимому, началось с Августа де Моргана в 1838 году как улучшение приближения де Мойвра. См., Например, Hald (2007) [1]. Согласно описанию Халда, его рассуждения были такими же, как в пункте 4 выше (то есть, по сути, с точки зрения попытки приблизить pmf путем замены пика вероятности на «блок» шириной 1 с центром в значении x).

  3. Иллюстрация ситуации, когда исправление непрерывности не помогает:

    введите описание изображения здесь

    ИксYFИкс(Икс)FY(Икс+12)п(Икс)FY(Икс+12)-FY(Икс-12)FИкс(Икс)FY(Икс)п(Икс)FY(Икс)-FY(Икс-1)

    [1]: Хальд, Андерс (2007),
    "История параметрического статистического вывода от Бернулли до Фишера, 1713-1935",
    Источники и исследования по истории математики и физических наук,
    Springer-Verlag, Нью-Йорк

Glen_b - Восстановить Монику
источник
1

Я полагаю, что этот фактор обусловлен тем, что мы сравниваем непрерывное распределение с дискретным. Таким образом, нам нужно перевести, что означает каждое дискретное значение в непрерывном распределении. Мы могли бы выбрать другое значение, однако оно не было бы сбалансировано относительно данного целого числа. (т. е. вы бы взвесили вероятность быть на 6 больше к 7, чем к 5.)

Я нашел полезную ссылку здесь: ссылка

Киттер Каттер
источник