Объяснение конечного поправочного коэффициента

25

Я понимаю, что, когда выборка из конечной совокупности и нашего размера выборки составляет более 5% совокупности, нам необходимо скорректировать среднее значение выборки и стандартную ошибку, используя эту формулу:

FPC=NnN1

Где - размер популяции, а - размер выборки.nNn

У меня есть 3 вопроса по этой формуле:

  1. Почему порог установлен на 5%?
  2. Как была получена формула?
  3. Существуют ли другие онлайн-ресурсы, которые подробно объясняют эту формулу, кроме этой статьи?
Сара
источник
8
Вы не исправляете среднее!
whuber
2
Вы только исправляете дисперсию.
SmallChess

Ответы:

25

Порог выбирается таким, чтобы он обеспечивал сходимость гипергеометрического распределения ( - это ее SD) вместо биномиального распределения (для выборки с заменой) к нормальному распределению (это центральная предельная теорема, см., Например,нормальную кривую, центральную предельную теорему и неравенства Маркова и Чебычева для Случайные величины). Другими словами, когдаn/N0,05(т. Е.не слишком велико по сравнению с), FPC можно безопасно игнорировать; это легко увидетькак фактор коррекции эволюционирует с переменнымпри фиксированномN: сN=10,000, мы имеемFPC=NnN1n/N0.05N nnNnNN=10,000 , когда п = 10 , а FPC = .3162 , когда п = 9 , 000 . Когда N , FPC приближается к 1, и мы близки к ситуации выборки с заменой (т. Е. Как с бесконечной населенностью).FPC=.9995n=10FPC=.3162n=9,000N

Чтобы понять эти результаты, хорошей отправной точкой является чтение некоторых онлайн-учебников по теории выборки, где выборка производится без замены ( простая случайная выборка ). Этот онлайн-учебник по непараметрической статистике содержит иллюстрацию по вычислению ожиданий и дисперсии в целом.

Вы заметите, что некоторые авторы используют вместо N - 1 в знаменателе FPC; на самом деле, это зависит от того, работаете ли вы с выборкой или статистикой популяции: для дисперсии это будет N вместо N - 1, если вас интересует S 2, а не σ 2 .NN1NN1S2σ2

Что касается онлайн-ссылок, я могу предложить вам

хл
источник
Эта формула используется для конечного населения, но с заменой или без замены?
скан
3
@skan без замены.
Черное молоко