Все ли значения в пределах 95% доверительного интервала одинаково вероятны?

56

Я нашел противоречивую информацию по вопросу: « Если построить 95-процентный доверительный интервал (CI) разницы в средних значениях или различий в пропорциях, все ли значения в пределах CI одинаково вероятны? Или точечная оценка наиболее вероятна? с значениями вблизи "хвостов" CI менее вероятны, чем значения в середине CI?

Например, если в отчете о рандомизированном клиническом исследовании указано, что относительный риск смертности при конкретном лечении составляет 1,06 (95% ДИ от 0,96 до 1,18), является ли вероятность того, что 0,96 будет правильным значением, равным 1,06?

Я нашел много ссылок на эту концепцию в Интернете, но следующие два примера отражают неопределенность в ней:

  1. Модуль Лизы Салливан о доверительных интервалах гласит:

    Доверительные интервалы для разности средних обеспечивают диапазон вероятных значений для ( ). Важно отметить, что все значения в доверительном интервале являются одинаково вероятными оценками истинного значения ( ).μ1μ2μ1μ2

  2. Этот пост, озаглавленный « В пределах ошибки» , гласит:

    Я имею в виду недопонимание «предела погрешности», при котором все точки в пределах доверительного интервала рассматриваются с одинаковой вероятностью, как если бы в центральной предельной теореме подразумевалось ограниченное равномерное распределение вместо t- распределения. [...]
    Упущение, в котором говорится о «пределе погрешности», заключается в том, что возможности, близкие к точечной оценке, гораздо более вероятны, чем возможности, находящиеся на грани разницы ».

Это кажется противоречивым, так что же правильно?

pmgjones
источник
7
Интересно, есть ли где-то путаница со связанной концепцией, что p-значения равномерно распределены в соответствии с нулевой гипотезой?
Майкл МакГоуэн
4
Первая цитата - это ошибочное проскальзывание в другом точном счете доверительных интервалов. Вторая цитата взята из учетной записи, которая, мягко говоря, представляет собой небрежный беспорядок: она полна нечетких, неправильных утверждений или может быть интерпретирована только в байесовском смысле. Но обе цитаты неверны !
whuber
@whuber Я бы не назвал второй беспорядком ... Я бы назвал это байесовской интерпретацией интерпретации Frequentist :)
Майкл МакГоуэн
1
@Michael Один из примеров небрежности - это солецизм, так как утверждение CLT подразумевает, что «бесконечное число повторных оценок среднего значения [населения] будет по-прежнему следовать нормальному распределению». Человек не должен быть неправильными , чтобы общаться идеями просто к нетехнической аудитории.
whuber
2
@whuber, я считаю предложение, которое ты цитируешь, лишь незначительным грехом. Основная ошибка в том, что CLT не включает t-распределение.
стекловидно

Ответы:

23

Один вопрос, на который необходимо ответить, - что означает «вероятный» в этом контексте?

Если это означает вероятность (как это иногда используется как синоним), и мы используем строгие частые определения, тогда истинное значение параметра - это одно значение, которое не изменяется, поэтому вероятность (вероятность) этой точки равна 100%, и все другие значения 0%. Таким образом, почти все равны с вероятностью 0%, но если интервал содержит истинное значение, то он отличается от других.

Если мы используем байесовский подход, то CI (Credible Interval) происходит из апостериорного распределения, и вы можете сравнить вероятность в разных точках в пределах интервала. Если апостериор не является абсолютно однородным в пределах интервала (теоретически возможно, но это было бы странным обстоятельством), тогда значения имеют разные вероятности.

Если мы используем вероятность, похожую на достоверность, то подумайте об этом следующим образом: вычислите 95% доверительный интервал, 90% доверительный интервал и 85% доверительный интервал. Мы были бы на 5% уверены, что истинное значение находится в области внутри 95-процентного интервала, но за пределами 90-процентного интервала мы могли бы сказать, что истинное значение с вероятностью 5% упадет в этом регионе. То же самое верно для региона, который находится внутри интервала 90%, но за пределами интервала 85%. Таким образом, если каждое значение одинаково вероятно, тогда размер двух вышеуказанных областей должен быть одинаковым, и то же самое будет справедливо для региона в пределах 10% доверительного интервала, но за пределами 5% доверительного интервала. Ни одно из стандартных распределений, с помощью которых построены интервалы, не обладает этим свойством (кроме особых случаев с 1 отрисовкой из униформы).

Кроме того, вы можете доказать это себе, моделируя большое количество наборов данных из известных групп населения, вычисляя интересующий доверительный интервал, а затем сравнивая, как часто истинный параметр ближе к точечной оценке, чем к каждой из конечных точек.

Грег Сноу
источник
3
Вероятность - это то, что нужно в ответе на этот вопрос, а не вероятность, частая или байесовская. Вероятность дает точный ответ, другие могут сделать это только с некоторым скручиванием и растяжением.
Майкл Лью
1
@ Грег, мне нравится твое объяснение. Просто чтобы прояснить, ваш аргумент поддерживает идею о том, что значения в «хвостах» 95% -ного КИ менее вероятны (менее вероятны), чем те, которые ближе к точечной оценке, верно? Спасибо за ваш ответ.
pmgjones
1
@pmgjones менее вероятно, НЕТ, см. 2-й абзац. Менее вероятно в контексте 4-го абзаца, да.
Грег Сноу,
2
@GregSnow Ваш второй абзац говорит почти точно, что вероятность того, что истинный параметр является истинным параметром, равна 100%. Вы действительно верите, что эта тавтология - это то, что могут предложить «строгие частые определения»?
rolando2
2
@ rolando2, я думаю, что статистика по частоте может многое предложить, я просто устранил распространенные искажения, которые подразумевают, что истинное значение изменяется, и иногда выходит за пределы интервала, а иногда внутри интервала (а иногда ближе к границам, а иногда ближе к центр). Более поздние параграфы тогда получают более истинное чувство для идей.
Грег Сноу
19

Это большой вопрос! Существует математическая концепция, называемая вероятностью, которая поможет вам понять проблемы. Фишер изобрел вероятность, но посчитал ее несколько менее желательной, чем вероятность, но вероятность оказалась более «примитивной», чем вероятность, и Йен Хаккинг (1965) счел ее аксиоматической в ​​том смысле, что она не доказуема. Вероятность лежит в основе вероятности, а не наоборот.

Взлом, 1965. Логика статистического вывода .

Вероятности не уделяется внимания, которое должно иметься в стандартных учебниках статистики, без уважительной причины. Он отличается от вероятности тем, что обладает почти точно теми свойствами, которые можно ожидать, а функции и интервалы правдоподобия очень полезны для вывода. Возможно, некоторые статистики не любят правдоподобие, потому что иногда нет «правильного» способа получить соответствующие функции правдоподобия. Однако во многих случаях функции правдоподобия очевидны и четко определены. Изучение вероятностей для вывода, вероятно, должно начаться с небольшой и простой для понимания книги Ричарда Рояля под названием « Статистические данные: парадигма вероятности» .

Ответ на ваш вопрос заключается в том, что нет, точки в любом интервале не имеют одинаковую вероятность. Те, кто находится на границах доверительного интервала, обычно имеют меньшую вероятность, чем другие, к центру интервала. Конечно, обычный доверительный интервал ничего не говорит вам напрямую о параметре, относящемся к конкретному эксперименту. Доверительные интервалы Неймана являются «глобальными» в том смысле, что они имеют долгосрочные свойства, а не «локальные» свойства, относящиеся к проводимому эксперименту. (К счастью, хорошие долгосрочные показатели можно интерпретировать на местном уровне, но это скорее интеллектуальное сокращение, а не математическая реальность.) Интервалы правдоподобия - в тех случаях, когда они могут быть построены - напрямую отражают вероятность, касающуюся эксперимента в руке.

Майкл Лью
источник
1
@suncoolsu Необязательно, чтобы рассматриваемый интервал был интервалом вероятности, чтобы утверждение было истинным. Интервал должен охватывать только наиболее вероятную оценку, так что границы интервала менее вероятны, чем точка в интервале. Любой обычный доверительный интервал будет удовлетворять этому требованию.
Майкл Лью
2
@pmjones 95% -й КИ НЕ ДОПУСКАЕТ, если значения к краям КИ ближе к истине, чем значения в середине. ИК делают заявления о повторной выборке из населения. В долгосрочной перспективе (т. Е. После повторной выборки) 95% таких КИ, которые построены для каждой выборки, будут покрывать истинное значение. Следовательно, есть два ключевых наблюдения: 1) Никто не может ничего сказать об истинном значении для данного КИ. 2) КИ ничего не говорят вам о наблюдаемых данных, что является обычной байесовской критикой.
Suncoolsu
1
@MichaelLew Принцип правдоподобия полезен, но я говорил, что (цитируя LW) «Действительно, все частые выводы нарушают LP, поэтому, если мы будем придерживаться LP, нам придется отказаться от частых выводов». Поскольку CI - это идея для частых людей, она нарушает LP (что, по вашему мнению, является фундаментальным).
Suncoolsu
1
@suncollsu Вопрос не в том, говорит ли один доверительный интервал и без каких-либо других статистических соображений о вероятности значений параметров внутри себя. Речь идет о вероятности значений параметров в пределах интервала. Функция правдоподобия отвечает на вопрос, и этот ответ является правильным, даже если доверительный интервал нарушает принцип правдоподобия. (Прочитайте мой предыдущий комментарий еще раз. Вы, кажется, полностью проигнорировали его содержание.)
Майкл Лью
2
@ rolando2 95% доверительные интервалы Неймана разработаны таким образом, чтобы метод содержал истинный параметр в 95% случаев, когда этот метод используется. Строго говоря, доверие присуще методу, а не какому-либо отдельному интервалу, и поэтому индивидуальный интервал ничего не говорит вам о состоянии мира в этом конкретном эксперименте. Смотрите мой ответ на этот вопрос для более подробной информации: stats.stackexchange.com/questions/8844/…
Майкл Лью
18

Предположим, кто-то сказал мне, что я должен в равной степени доверять всем ценностям в рамках CI95 в качестве потенциальных показателей ценности населения. (Я намеренно избегаю терминов «вероятный» и «вероятный».) Что особенного в 95? Ничего: чтобы быть непротиворечивым, мне также пришлось бы в равной степени доверять всем значениям в CI96, CI97, ... и CI99.9999999. По мере того, как охват CI приближался к своему пределу, должны быть включены практически все действительные числа. Нелепость этого вывода заставит меня отказаться от первоначального требования.

rolando2
источник
4
Это отличный ответ! Я должен был подумать о влиянии приближения крайностей возможных КИ. Спасибо, что написали это!
pmgjones
2

Начнем с определения доверительного интервала. Если я скажу, что 95% доверительный интервал переходит от этого к этому, я имею в виду, что утверждения такого рода будут верны примерно в 95% случаев, а ложные примерно в 5% случаев. Я не обязательно имею в виду, что я на 95% уверен в этом конкретном утверждении. 90-процентный доверительный интервал будет уже, а 80-процентный уже. Поэтому, когда я задаюсь вопросом, что такое истинное значение, я меньше доверяю значениям, поскольку они становятся все ближе и ближе к границе любого конкретного доверительного интервала.

Обратите внимание, что все вышеперечисленное качественно, особенно «доверие». (Я избегал терминов «доверие» или «вероятность» в этом утверждении, потому что они несут математический багаж, который может отличаться от нашего интуитивного багажа.) Байесовские подходы перефразируют ваш вопрос к тому, что имеет количественный ответ, но я не хочу открывать это может червей здесь.

Box, классический текст Hunter & Hunter («Статистика для экспериментаторов», Wiley, 1978) также может помочь. См. «Наборы доверительных интервалов» на стр. 113, след.

Эмиль Фридман
источник
Поскольку мы имеем дело частично с концепциями, а частично с семантикой, я укажу, что во втором предложении вы сказали «... утверждения такого рода будут истинными ...», не уточняя, какие утверждения будут истинными.
rolando2