Клоппер-Пирсон для нематематиков

12

Мне было интересно, если кто-нибудь может объяснить мне интуицию за пределами Клоппера-Пирсона CI для пропорций.

Насколько я знаю, каждый CI включает в себя дисперсию. Однако для пропорций, даже если моя пропорция равна 0 или 1 (0% или 100%), CI Клоппера-Пирсона можно рассчитать. Я попытался взглянуть на формулы, и я понимаю, что в этом есть что-то с процентилями биномиального распределения, и я понимаю, что поиск КИ включает в себя итерации, но мне было интересно, может ли кто-нибудь объяснить логику и рациональность в «простых словах» или с минимальной математикой ?

user40850
источник

Ответы:

22

Когда вы говорите, что привыкли к доверительным интервалам, содержащим выражение для дисперсии, вы вспоминаете случай Гаусса, в котором информация о двух параметрах, характеризующих популяцию - один ее средний, а другой - дисперсия, суммируется по выборке. среднее и выборочная дисперсия. Среднее значение выборки оценивает среднее значение популяции, но точность, с которой оно это делает, зависит от дисперсии совокупности, которая, в свою очередь, оценивается по дисперсии выборки. Биномиальное распределение, с другой стороны, имеет только один параметр - вероятность успеха в каждом отдельном испытании - и вся информация, представленная выборкой об этом параметре, суммируется в общем количестве нет. успехи из стольких независимых испытаний. Дисперсия населения и среднее значение определяются этим параметром.

Вы можете получить 95% (скажем) доверительный интервал Клоппера – Пирсона для параметра работающего непосредственно с биномиальной функцией вероятности. Предположим, вы наблюдаете успехов из испытаний. PMF этоx nπxn

Pr(X=x)=(nx)πx(1π)nx

Увеличивайте до тех пор, пока вероятность успеха или меньше не упадет до 2,5%: это ваша верхняя граница. Уменьшайте до тех пор, пока вероятность успеха или более не упадет до 2,5%: это ваша нижняя граница. (Я предлагаю вам на самом деле попытаться сделать это, если не ясно, прочитав об этом.) То, что вы делаете здесь, - это поиск значений которые, если принять нулевую гипотезу, приведут к тому, что ее (только просто) будет отвергнуть двусторонний тест на уровне значимости 5%. В долгосрочной перспективе границы, рассчитанные таким образом, покрывают истинное значение , как бы то ни было, по крайней мере, 95% времени.πxπxππ

Scortchi - Восстановить Монику
источник
+1. Это может заслуживать отдельного вопроса, но я быстро задам его здесь: для конкретного приложения я хотел бы получить одну меру неопределенности (что-то, что ведет себя как стандартная ошибка среднего) для различных пропорций. Я знаю, что есть ряд биномиальных процедур КИ, включая Клоппера-Пирсона. Имеет ли смысл принимать ширину такого КИ в качестве меры неопределенности? Или, возможно, width / 1,96 / 2, чтобы получить точно SEM в гауссовом пределе.
говорит амеба: восстанови Монику
1
@amoeba: Предположительно, вы думаете о небольших размерах выборки: (1) Вы, вероятно, захотите что-то вроде КИ Blaker-Spjotvoll, а не КИ, основанные на тесте с равным хвостовым участком. (2) Распределение достоверности довольно изменчиво, что делает ширину любого данного интервала неприятно чувствительной к покрытию, которое вы определяете.
Scortchi - Восстановить Монику