Я нашел противоречивую информацию по вопросу: « Если построить 95-процентный доверительный интервал (CI) разницы в средних значениях или различий в пропорциях, все ли значения в пределах CI одинаково вероятны? Или точечная оценка наиболее вероятна? с значениями вблизи "хвостов" CI менее вероятны, чем значения в середине CI?
Например, если в отчете о рандомизированном клиническом исследовании указано, что относительный риск смертности при конкретном лечении составляет 1,06 (95% ДИ от 0,96 до 1,18), является ли вероятность того, что 0,96 будет правильным значением, равным 1,06?
Я нашел много ссылок на эту концепцию в Интернете, но следующие два примера отражают неопределенность в ней:
Модуль Лизы Салливан о доверительных интервалах гласит:
Доверительные интервалы для разности средних обеспечивают диапазон вероятных значений для ( ). Важно отметить, что все значения в доверительном интервале являются одинаково вероятными оценками истинного значения ( ).
Этот пост, озаглавленный « В пределах ошибки» , гласит:
Я имею в виду недопонимание «предела погрешности», при котором все точки в пределах доверительного интервала рассматриваются с одинаковой вероятностью, как если бы в центральной предельной теореме подразумевалось ограниченное равномерное распределение вместо t- распределения. [...]
Упущение, в котором говорится о «пределе погрешности», заключается в том, что возможности, близкие к точечной оценке, гораздо более вероятны, чем возможности, находящиеся на грани разницы ».
Это кажется противоречивым, так что же правильно?
источник
Ответы:
Один вопрос, на который необходимо ответить, - что означает «вероятный» в этом контексте?
Если это означает вероятность (как это иногда используется как синоним), и мы используем строгие частые определения, тогда истинное значение параметра - это одно значение, которое не изменяется, поэтому вероятность (вероятность) этой точки равна 100%, и все другие значения 0%. Таким образом, почти все равны с вероятностью 0%, но если интервал содержит истинное значение, то он отличается от других.
Если мы используем байесовский подход, то CI (Credible Interval) происходит из апостериорного распределения, и вы можете сравнить вероятность в разных точках в пределах интервала. Если апостериор не является абсолютно однородным в пределах интервала (теоретически возможно, но это было бы странным обстоятельством), тогда значения имеют разные вероятности.
Если мы используем вероятность, похожую на достоверность, то подумайте об этом следующим образом: вычислите 95% доверительный интервал, 90% доверительный интервал и 85% доверительный интервал. Мы были бы на 5% уверены, что истинное значение находится в области внутри 95-процентного интервала, но за пределами 90-процентного интервала мы могли бы сказать, что истинное значение с вероятностью 5% упадет в этом регионе. То же самое верно для региона, который находится внутри интервала 90%, но за пределами интервала 85%. Таким образом, если каждое значение одинаково вероятно, тогда размер двух вышеуказанных областей должен быть одинаковым, и то же самое будет справедливо для региона в пределах 10% доверительного интервала, но за пределами 5% доверительного интервала. Ни одно из стандартных распределений, с помощью которых построены интервалы, не обладает этим свойством (кроме особых случаев с 1 отрисовкой из униформы).
Кроме того, вы можете доказать это себе, моделируя большое количество наборов данных из известных групп населения, вычисляя интересующий доверительный интервал, а затем сравнивая, как часто истинный параметр ближе к точечной оценке, чем к каждой из конечных точек.
источник
Это большой вопрос! Существует математическая концепция, называемая вероятностью, которая поможет вам понять проблемы. Фишер изобрел вероятность, но посчитал ее несколько менее желательной, чем вероятность, но вероятность оказалась более «примитивной», чем вероятность, и Йен Хаккинг (1965) счел ее аксиоматической в том смысле, что она не доказуема. Вероятность лежит в основе вероятности, а не наоборот.
Взлом, 1965. Логика статистического вывода .
Вероятности не уделяется внимания, которое должно иметься в стандартных учебниках статистики, без уважительной причины. Он отличается от вероятности тем, что обладает почти точно теми свойствами, которые можно ожидать, а функции и интервалы правдоподобия очень полезны для вывода. Возможно, некоторые статистики не любят правдоподобие, потому что иногда нет «правильного» способа получить соответствующие функции правдоподобия. Однако во многих случаях функции правдоподобия очевидны и четко определены. Изучение вероятностей для вывода, вероятно, должно начаться с небольшой и простой для понимания книги Ричарда Рояля под названием « Статистические данные: парадигма вероятности» .
Ответ на ваш вопрос заключается в том, что нет, точки в любом интервале не имеют одинаковую вероятность. Те, кто находится на границах доверительного интервала, обычно имеют меньшую вероятность, чем другие, к центру интервала. Конечно, обычный доверительный интервал ничего не говорит вам напрямую о параметре, относящемся к конкретному эксперименту. Доверительные интервалы Неймана являются «глобальными» в том смысле, что они имеют долгосрочные свойства, а не «локальные» свойства, относящиеся к проводимому эксперименту. (К счастью, хорошие долгосрочные показатели можно интерпретировать на местном уровне, но это скорее интеллектуальное сокращение, а не математическая реальность.) Интервалы правдоподобия - в тех случаях, когда они могут быть построены - напрямую отражают вероятность, касающуюся эксперимента в руке.
источник
Предположим, кто-то сказал мне, что я должен в равной степени доверять всем ценностям в рамках CI95 в качестве потенциальных показателей ценности населения. (Я намеренно избегаю терминов «вероятный» и «вероятный».) Что особенного в 95? Ничего: чтобы быть непротиворечивым, мне также пришлось бы в равной степени доверять всем значениям в CI96, CI97, ... и CI99.9999999. По мере того, как охват CI приближался к своему пределу, должны быть включены практически все действительные числа. Нелепость этого вывода заставит меня отказаться от первоначального требования.
источник
Начнем с определения доверительного интервала. Если я скажу, что 95% доверительный интервал переходит от этого к этому, я имею в виду, что утверждения такого рода будут верны примерно в 95% случаев, а ложные примерно в 5% случаев. Я не обязательно имею в виду, что я на 95% уверен в этом конкретном утверждении. 90-процентный доверительный интервал будет уже, а 80-процентный уже. Поэтому, когда я задаюсь вопросом, что такое истинное значение, я меньше доверяю значениям, поскольку они становятся все ближе и ближе к границе любого конкретного доверительного интервала.
Обратите внимание, что все вышеперечисленное качественно, особенно «доверие». (Я избегал терминов «доверие» или «вероятность» в этом утверждении, потому что они несут математический багаж, который может отличаться от нашего интуитивного багажа.) Байесовские подходы перефразируют ваш вопрос к тому, что имеет количественный ответ, но я не хочу открывать это может червей здесь.
Box, классический текст Hunter & Hunter («Статистика для экспериментаторов», Wiley, 1978) также может помочь. См. «Наборы доверительных интервалов» на стр. 113, след.
источник