Как лучше всего рассчитать доверительный интервал биномиального эксперимента, если ваша оценка такова, что (или аналогично ) и размер выборки относительно мал, например, ?
confidence-interval
binomial
Kasper
источник
источник
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Ответы:
Не используйте нормальное приближение
Много было написано об этой проблеме. Общий совет - никогда не использовать нормальное приближение (т. Е. Асимптотический / доверительный интервал Вальда), поскольку оно обладает ужасными свойствами покрытия. R код для иллюстрации этого:
Для малых вероятностей успеха вы можете запросить 95% доверительный интервал, но на самом деле получите, скажем, 10% доверительный интервал!
рекомендации
Так что мы должны использовать? Я полагаю, что текущие рекомендации - это те, которые перечислены в статье Оценка интервалов для биномиальной пропорции Брауна, Кая и DasGupta в Статистической науке 2001, том. 16, нет 2, стр. 101–133. Авторы рассмотрели несколько методов расчета доверительных интервалов и пришли к следующему выводу.
Интервал Уилсона также иногда называют интервалом оценки , поскольку он основан на инвертировании теста оценки.
Расчет интервалов
Чтобы рассчитать эти доверительные интервалы, вы можете использовать этот онлайн-калькулятор или
binom.confint()
функцию изbinom
пакета в R. Например, для 0 успехов в 25 испытаниях код R будет иметь вид:Вот
bayes
интервал Джеффриса. (Аргументtype="central"
необходим для получения равноправного интервала.)Обратите внимание, что вы должны решить, какой из трех методов вы хотите использовать, прежде чем вычислять интервал. Глядя на все три и выбирая самый короткий, естественно, вы получите слишком малую вероятность покрытия.
Быстрый, приблизительный ответ
В заключение: если вы наблюдаете ровно ноль успехов в ваших n испытаниях и просто хотите очень приблизительный доверительный интервал, вы можете использовать правило трех . Просто разделите число 3 на n . В приведенном выше примере n равно 25, поэтому верхняя граница равна 3/25 = 0,12 (нижняя граница, конечно, равна 0).
источник
bayes
использует одинаковый априор (вместо Джеффри), когда оба параметра формы равны 1. Я написал по электронной почте сопровождающему пакета binom из любопытства о (не) преимуществах Джеффри и единообразного априора, и он сказал мне, что в новой версии будет использоваться униформа до по умолчанию. Так что не удивляйтесь, если результаты немного изменятся в будущем.binconf
МетодHmisc
также вычисляет эти интервалы. По умолчанию используется метод Уилсона.источник