Я понимаю, что, когда выборка из конечной совокупности и нашего размера выборки составляет более 5% совокупности, нам необходимо скорректировать среднее значение выборки и стандартную ошибку, используя эту формулу:
Где - размер популяции, а - размер выборки.n
У меня есть 3 вопроса по этой формуле:
- Почему порог установлен на 5%?
- Как была получена формула?
- Существуют ли другие онлайн-ресурсы, которые подробно объясняют эту формулу, кроме этой статьи?
Ответы:
Порог выбирается таким, чтобы он обеспечивал сходимость гипергеометрического распределения ( - это ее SD) вместо биномиального распределения (для выборки с заменой) к нормальному распределению (это центральная предельная теорема, см., Например,нормальную кривую, центральную предельную теорему и неравенства Маркова и Чебычева для Случайные величины). Другими словами, когдаn/N≤0,05(т. Е.не слишком велико по сравнению с), FPC можно безопасно игнорировать; это легко увидетькак фактор коррекции эволюционирует с переменнымпри фиксированномN: сN=10,000, мы имеемFPC=N- нN- 1----√ п / Н≤ 0,05 N nN N N N N= 10 , 000 , когда п = 10 , а FPC = .3162 , когда п = 9 , 000 . Когда N → ∞ , FPC приближается к 1, и мы близки к ситуации выборки с заменой (т. Е. Как с бесконечной населенностью).FPC = .9995 n = 10 FPC = .3162 n = 9 , 000 N→ ∞
Чтобы понять эти результаты, хорошей отправной точкой является чтение некоторых онлайн-учебников по теории выборки, где выборка производится без замены ( простая случайная выборка ). Этот онлайн-учебник по непараметрической статистике содержит иллюстрацию по вычислению ожиданий и дисперсии в целом.
Вы заметите, что некоторые авторы используют вместо N - 1 в знаменателе FPC; на самом деле, это зависит от того, работаете ли вы с выборкой или статистикой популяции: для дисперсии это будет N вместо N - 1, если вас интересует S 2, а не σ 2 .N N−1 N N−1 S2 σ2
Что касается онлайн-ссылок, я могу предложить вам
источник