Я читал учебник по статистике начального уровня. В главе, посвященной оценке максимального правдоподобия доли успеха в данных с биномиальным распределением, он дал формулу для расчета доверительного интервала, а затем упомянул небрежно
Рассмотрим его фактическую вероятность покрытия, то есть вероятность того, что метод создает интервал, который фиксирует истинное значение параметра. Это может быть немного меньше, чем номинальное значение.
И далее предлагается создать альтернативный «доверительный интервал», который предположительно содержит фактическую вероятность покрытия.
Я впервые столкнулся с идеей номинальной и фактической вероятности покрытия. Пробираясь сквозь старые вопросы здесь, я думаю, что у меня есть понимание: есть два разных понятия, которые мы называем вероятностью, во-первых, насколько вероятно, что еще не произошедшее событие даст определенный результат, и второе насколько вероятно, что предположение агента-наблюдателя о результате уже произошедшего события верно. Также казалось, что доверительные интервалы измеряют только первый тип вероятности, а то, что называется «достоверные интервалы», измеряет второй тип вероятности. Я кратко предположил, что доверительные интервалы - это те, которые рассчитывают «номинальную вероятность покрытия», а вероятные интервалы - это те, которые охватывают «фактическую вероятность покрытия».
Но, возможно, я неправильно истолковал книгу (не совсем понятно, предназначены ли различные методы расчета для доверительного интервала и вероятного интервала или для двух различных типов доверительных интервалов) или для других источников, к которым я приходил мое текущее понимание. Особенно комментарий, который я получил по другому вопросу,
Доверительные интервалы для частых, достоверные для байесовских
заставил меня усомниться в моих выводах, так как книга не описывала байесовский метод в этой главе.
Поэтому, пожалуйста, уточните, правильно ли мое понимание или я допустил логическую ошибку в пути.
Ответы:
Как правило, фактическая вероятность покрытия никогда не будет равна номинальной вероятности, когда вы работаете с дискретным распределением.
Доверительный интервал определяется как функция данных. Если вы работаете с биномиальным распределением, существует только конечное число возможных результатов ( точнее ), поэтому существует только конечное число возможных доверительных интервалов. Поскольку параметр является непрерывным, довольно легко увидеть, что вероятность покрытия (которая является функцией от ) не может быть лучше, чем приблизительно 95% (или что-то еще).p pn+1 p p
Обычно верно, что методы, основанные на CLT, будут иметь вероятности покрытия ниже номинального значения, но другие методы могут на самом деле быть более консервативными.
источник
Это не имеет ничего общего с байесовскими достоверными интервалами против частых доверительных интервалов. 95% (скажем) доверительный интервал определяется как обеспечивающий охват не менее 95% независимо от истинного значения параметра . Таким образом, когда номинальное покрытие составляет 95%, фактическое покрытие может составлять 97% при , 96,5% при , но при отсутствии значения оно составляет менее 95%. Проблема (то есть несоответствие между номинальным и фактическим покрытием) возникает с дискретными распределениями, такими как биномиальное.π = π 1 π = π 2 ππ π=π1 π=π2 π
В качестве иллюстрации рассмотрим наблюдение за успехами из биномиальных испытаний с неизвестной вероятностью успеха : В первом столбце показаны возможные наблюдаемые значения . Вторая показывает точное † верхнее ‡ доверительное ограничениеx n π
Номинальное покрытие достигается только тогда, когда истинные значения параметров совпадают с достижимыми верхними границами.
[Я просто перечитал ваш вопрос и заметил, что автор говорит, что фактическая вероятность может быть меньше, чем номинальная вероятность покрытия. Поэтому я считаю, что они говорят о приблизительном методе расчета доверительного интервала, хотя то, что я сказал выше, все еще продолжается. На графике можно предложить сообщить о среднем уровне достоверности около но - усредняя значения неизвестного параметра?]98%
† Точно в том смысле, что фактическое покрытие никогда не меньше номинального покрытия для любого значения , и равно ему для некоторых значений - @ Unwisdom's sense, а не @ Stephane's.ππ π
‡ Интервалы с верхними и нижними границами, конечно, чаще используются; но немного сложнее объяснить, и есть только один точный интервал для рассмотрения только с верхней границей. (См. Blaker (2000), «Кривые достоверности и улучшенные точные доверительные интервалы для дискретных распределений», Канадский журнал статистики , 28 , 4 и ссылки.)
источник
Я думаю, что разница на самом деле заключается в использовании приближений, сделанных при расчете доверительных интервалов. Например, если мы используем довольно стандартный CI
Мы можем назвать это «доверительным интервалом 95%». Однако, как правило, здесь делается несколько приближений. Если мы не сделаем аппроксимации, то мы можем рассчитать фактическое покрытие. Типичная ситуация при оценке стандартной ошибки. Тогда интервалы слишком узки, чтобы получить истинное значение с вероятностью 95%. Они могут получить только истинное значение, скажем, с вероятностью 85%. Вероятность «фактического покрытия» может быть рассчитана с использованием имитационного моделирования Монте-Карло (например, сгенерировать выборочных наборов данных, используя выбранное истинное значение, затем рассчитать 95% -й доверительный интервал для каждого и найти, что действительно содержит истинное значение).+8501000 850
источник