Когда вы говорите, что привыкли к доверительным интервалам, содержащим выражение для дисперсии, вы вспоминаете случай Гаусса, в котором информация о двух параметрах, характеризующих популяцию - один ее средний, а другой - дисперсия, суммируется по выборке. среднее и выборочная дисперсия. Среднее значение выборки оценивает среднее значение популяции, но точность, с которой оно это делает, зависит от дисперсии совокупности, которая, в свою очередь, оценивается по дисперсии выборки. Биномиальное распределение, с другой стороны, имеет только один параметр - вероятность успеха в каждом отдельном испытании - и вся информация, представленная выборкой об этом параметре, суммируется в общем количестве нет. успехи из стольких независимых испытаний. Дисперсия населения и среднее значение определяются этим параметром.
Вы можете получить 95% (скажем) доверительный интервал Клоппера – Пирсона для параметра работающего непосредственно с биномиальной функцией вероятности. Предположим, вы наблюдаете успехов из испытаний. PMF этоx nπxn
Pr(X=x)=(nx)πx(1−π)n−x
Увеличивайте до тех пор, пока вероятность успеха или меньше не упадет до 2,5%: это ваша верхняя граница. Уменьшайте до тех пор, пока вероятность успеха или более не упадет до 2,5%: это ваша нижняя граница. (Я предлагаю вам на самом деле попытаться сделать это, если не ясно, прочитав об этом.) То, что вы делаете здесь, - это поиск значений которые, если принять нулевую гипотезу, приведут к тому, что ее (только просто) будет отвергнуть двусторонний тест на уровне значимости 5%. В долгосрочной перспективе границы, рассчитанные таким образом, покрывают истинное значение , как бы то ни было, по крайней мере, 95% времени.πxπxππ