Что именно является доверительным интервалом?

86

Я примерно и неофициально знаю, что такое доверительный интервал. Однако я не могу обернуться вокруг одной довольно важной детали: согласно Википедии:

Доверительный интервал не предсказывает, что истинное значение параметра имеет конкретную вероятность нахождения в доверительном интервале с учетом фактически полученных данных.

Я также видел подобные замечания, сделанные в нескольких местах на этом сайте. Более правильное определение, также из Википедии, таково:

если доверительные интервалы построены по многим отдельным анализам данных повторных (и, возможно, различных) экспериментов, доля таких интервалов, которые содержат истинное значение параметра, будет приблизительно соответствовать доверительному уровню

Опять же, я видел подобные замечания, сделанные в нескольких местах на этом сайте. Я не понимаю Если при повторных экспериментах доля вычисленных доверительных интервалов, которые содержат истинный параметр равна , то как может вероятность того, что находится в доверительном интервале, вычисленном для фактического эксперимента, быть отличной от ? Я ищу следующее в ответе:( 1 - α ) θ ( 1 - α )θ(1α)θ(1α)

  1. Разъяснение различия между неправильным и правильным определениями выше.

  2. Формальное, точное определение доверительного интервала, которое ясно показывает, почему первое определение неверно.

  3. Конкретный пример случая, когда первое определение явно неверно, даже если базовая модель верна.

dsimcha
источник
4
В этом посте есть хорошее обсуждение вопроса о доверительных интервалах stats.stackexchange.com/questions/2356/… . Я думаю, что статья, упомянутая в посте, помогает пролить свет на то, почему вышеприведенные определения верны для доверительных интервалов. Часто при просмотре того, как КИ ломаются, можно лучше понять их.
вероятностная
2
Часть меня приветствует вопрос (+1). Противоборствующая сторона хочет указать на то, что 1. Подавляющее большинство потребителей статистики, людей, которые используют статистику прагматично, но не философски, чтобы высказать свое мнение в области химии или исследования рынка, никогда не поймут тонкости вопросов, и мы часто будем затрудняюсь объяснить результаты. 2. Даже некоторые статисты-пуристы могут попасть в ловушку, сделав предположительно вероятностные заявления, подобные тем, которые включают доверительные интервалы, когда они не работают со случайными выборками. Гораздо большая проблема.
rolando2
3
@ Mario Ваше предположение не соответствует действительности! Мы ожидаем, что из 100 повторений эксперимента 95 КИ (а не средств) будут содержать истинное (но неизвестное) среднее значение. CI является случайным, но истинное среднее значение не является.
uber
6
Есть хорошая статья Cumming & Maillardet (2006), показывающая, что не 95% средств репликации попадут в исходный CI, а только 83,4% (они называют это значение «процент захвата»). Причина в том, что существует два источника изменчивости: A) изменчивость исходного среднего значения вокруг mu, и, B) изменчивость среднего значения репликации вокруг mu. Большинство людей забывают: оригинальный КИ не обязательно построен вокруг mu!
Феликс С
2
Заинтересованные читатели могут также захотеть увидеть эту ветку: почему 95% -й КИ не подразумевает 95-процентную вероятность сдерживания среднего значения?
gung - Восстановить Монику

Ответы:

26

Я нашел этот мысленный эксперимент полезным, когда думал о доверительных интервалах. Это также отвечает на ваш вопрос 3.

Пусть и . Рассмотрим два наблюдения для принимая значения и соответствующие наблюдениям и для , и пусть и . Тогда - это 50% доверительный интервал для (поскольку интервал включает себя if или , каждый из которых имеет вероятность ).Y = X + a - 1XU(0,1)Y=X+a12Yy1y2x1x2Xyl=min(y1,y2)yu=max(y1,y2)[yl,yu]aax1<12<x2x1>12>x214

Однако, если то мы знаем, что вероятность того, что интервал содержит равна , а не . Тонкость заключается в том, что доверительный интервал для параметра означает, что конечные точки интервала (которые являются случайными переменными) лежат по обе стороны от параметра с вероятностью до вычисления интервала , а не с вероятностью параметра лежащий в пределах интервала после того, как вы вычислили интервал .yuyl>12a112z%z% z%

Крис Тейлор
источник
3
Заметим, что почти наверняка, поэтому интервал содержит параметр с вероятностью ноль. На самом деле ваш аргумент работает, если вы оцениваете . Y>a[yl,yu]aθ=a+12
сделал
4
Я не думаю, что этот встречный пример действителен, потому что вы знаете только вероятность того, что интервал, содержащий равен единице после того, как вы увидели, что . Вполне разумно, чтобы вероятность изменилась после получения дополнительной информации. Если бы все, что вы знали, было то, что интервал был 50% -ным доверительным интервалом, тогда вероятность все равно была бы 1/2 (хотя это была бы байесовская вероятность, а не частая, поскольку она применяется к определенному событию, которое не имеет длительной частоты выполнения)θyuyl>1/2
Дикран Marsupial
1
Это действительно хороший пример, но я категорически не согласен с вашими утверждениями о вероятностях, которые каким-то образом изменились до и после расчета доверительного интервала. Это не имеет смысла и создает впечатление, что математика как-то заботится о том, что вы знаете, а что нет. Это не !! У вас всегда есть, что равно . Вы также всегда имеете, что равен . Это не противоречие, одна - просто безусловная вероятность, а другая - условная вероятность. P(a[yl,yu])12P(a[yl,yu]|yuyl>12)1
фгп
2
@fgp, да, возможно, это плохая формулировка со стороны Тейлора, говорящая об изменении вероятностей. Вероятности не меняются. Аргумент показывает, как легко возникают ситуации, демонстрирующие, что ошибочное понимание CI приводит к логическим проблемам. Если вы считаете, что наблюдаемый вами КИ имеет 50% -ную вероятность быть правильным, но это не может быть правильным, то вы понимаете, что КИ неверен.
Джон
36

Есть много вопросов, касающихся доверительных интервалов, но давайте сосредоточимся на цитатах. Проблема заключается в возможных неправильных интерпретациях, а не в правильности. Когда люди говорят «параметр имеет определенную вероятность» чего-либо, они думают о параметре как о случайной переменной. Это не точка зрения (классической) процедуры доверительного интервала, для которой случайной величиной является сам интервал, а параметр определяется не случайно, но пока неизвестно. Вот почему такие заявления часто подвергаются нападкам.

Математически, если мы допустим, чтобы была любой процедурой, которая отображает данные на подмножества пространства параметров, и если (независимо от значения параметра может быть) утверждение определяет событие , затем - по определению - имеет вероятность для любого возможного значения . Когда является процедурой доверительного интервала с доверительной вероятностью предполагается, что эта вероятность имеет инфимум (по всем значениям параметров)tx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α, (С учетом этого критерия мы обычно выбираем процедуры, которые оптимизируют некоторые дополнительные свойства, такие как создание коротких доверительных или симметричных интервалов, но это отдельный вопрос.) Слабый закон больших чисел тогда оправдывает вторую цитату. Это, однако, не является определением доверительных интервалов: это просто свойство, которым они обладают.

Я думаю, что этот анализ ответил на вопрос 1, показывает, что предпосылка вопроса 2 неверна, и делает вопрос 3 спорным.

Whuber
источник
3
Спасибо за ответ на отличный вопрос. Могу ли я привести следующую аналогию для дальнейшего обсуждения? Предположим, я подбрасываю честную монету снова и снова. Тогда . Теперь я переворачиваю монету один раз, но не показываю вам, что я перевернул, и спрашиваю: «Какова вероятность того, что головы поднялись?». Как бы вы ответили на этот вопрос? P(Head)=.50
Вольфганг
3
Еще один способ сформулировать это: для небайесовцев единственными «вещами», которые могут иметь вероятность, являются возможные события - в смысле будущих результатов случайного эксперимента. Учитывая, что параметр имеет фиксированное истинное значение, если у вас есть интервал с конкретными значениями, это больше не является возможным событием, независимо от того, включен ли параметр в интервал. В результате вы можете быть уверены в процессе, который генерирует интервал, но не в двух конкретных числах.
Каракал
1
@ Caracal - просто пища для размышлений, является ли «подбрасывание монеты» по-настоящему «случайным»? Если вы скажете «да», то отклоните идею о том, что выпадение монеты из головы является детерминированной (но сложной) функцией многих вещей (скажем, ветра, высоты, силы и угла крена, веса монеты и т. Д. И т. Д.). .). Я думаю, что это показывает двойной стандарт «случайности», который применяется к мышлению, основанному на CI. Данные фиксированы, но мы не уверены в их значении (поэтому данные случайны ), в то время как параметры фиксированы, но мы не уверены в его значении ( поэтому параметры не случайны ).
вероятностная
4
@ Вольфганг Я не понимаю, как ваш пример относится к доверительным интервалам. Вы не запрашиваете ничего, связанного с параметром распределения. Ваша ситуация наиболее тесно связана с интервалами прогнозирования. Я думаю, что вся эта дискуссия может иметь некоторый интерес в этом контексте, но она не относится к теме о доверительных интервалах.
whuber
2
@whuber Вопрос о том, можно ли сделать утверждение о вероятности того или иного 95% -ного КИ, фиксирующего истинно неизвестный параметр, очень похож на вопрос о том, можно ли сделать утверждение о вероятности конкретного сальто, где результат до сих пор неизвестен. В долгосрочной перспективе 95% CI фиксируют этот параметр. В конечном счете, 50% сальто - головы. Можем ли мы сказать, что есть 95% -ная вероятность того, что конкретный КИ фиксирует этот параметр? Можем ли мы сказать, что есть 50% -ная вероятность, что головы подняты перед тем, как смотреть? Я бы сказал да обоим. Но некоторые люди могут не согласиться.
Вольфганг
19

Я бы не назвал определение КИ неправильным, но его легко неверно истолковать, поскольку существует более одного определения вероятности. КИ основаны на следующем определении вероятности (частое или онтологическое)

(1) вероятность предложения = долгосрочная доля случаев, когда предложение считается истинным, зависит от процесса генерации данных

Таким образом, чтобы быть концептуально действительным при использовании КИ, вы должны принять это определение вероятности. Если вы этого не сделаете, то ваш интервал не является CI, с теоретической точки зрения.

Вот почему определение использовало слово пропорция, а НЕ слово вероятность , чтобы прояснить, что используется определение вероятности "долгосрочной частоты".

Основное альтернативное определение вероятности (гносеологическое или вероятностное как продолжение дедуктивной логики или байесовского)

(2) вероятность суждения = рациональная степень убежденности в том, что суждение истинно, зависит от состояния знания

Люди часто интуитивно путают оба эти определения и используют любую интерпретацию, которая обращается к их интуиции. Это может привести вас в самые разные запутанные ситуации (особенно когда вы переходите от одной парадигмы к другой).

То, что два подхода часто приводят к одному и тому же результату, означает, что в некоторых случаях мы имеем:

рациональная степень уверенности в том, что суждение истинно, зависит от состояния знаний = долгосрочная доля раз, когда суждение считается истинным, зависит от процесса генерирования данных

Дело в том, что оно не выполняется универсально , поэтому мы не можем ожидать, что два разных определения всегда приведут к одним и тем же результатам. Таким образом, если вы на самом деле не разработаете байесовское решение, а затем не обнаружите, что оно совпадает с интервалом, вы не можете дать интервал, заданный CI, интерпретацией как вероятность содержания истинного значения. И если вы это сделаете, то интервал - это не доверительный интервал, а достоверный интервал.

probabilityislogic
источник
2
Я не понимаю, почему вероятность предложения согласно определению 1 должна быть рациональным числом. Долгосрочная пропорция, кажется, относится к пределу пропорций времени, так что это предположение считается истинным. Каждая пропорция является рациональным числом, но их предел не может быть. ( К счастью, эта скобка ваш кажется тангенциальным в лучшем случае к остальной части Вашего ответа.)
ли
3
@probability Этот ответ, кажется, сбивает нас с толку не очень конструктивным образом. Приравнивание вероятности и пропорции является формой онтологической путаницы, сродни приравниванию температуры к уровню ртути в термометре: одно является теоретической конструкцией, а другое - физическим явлением, используемым для ее измерения. Это обсуждается на stats.stackexchange.com/questions/1525/… .
whuber
@Didier - вы правы, на самом деле последовательность , что является рациональными терминами с иррациональным пределом. Я удалил это замечание. Спасибо, что подняли это. xn=r2xn1+xn12r
вероятностная
6
@whuber - этот вопрос уместен, потому что именно это недоразумение заставляет людей неверно истолковывать КИ. Смешение вероятности с «рациональной степенью веры» не согласуется с парадигмой частоты. Вот что происходит, когда вы воспринимаете КИ как «вероятность того, что истинное значение будет в интервале», что и делает @dsimcha в вопросе.
вероятностная
1
@probability Спасибо за объяснение. Я понял, что ваш ответ соответствует определению «вероятность = пропорция». На самом деле, тщательное перечитывание все еще предполагает, что это то, что вы говорите в третьем абзаце, хотя ваш комментарий теперь характеризует это как недоразумение. Вы можете уточнить этот момент.
whuber
6

У RA Фишера был критерий полезности доверительных интервалов: КИ не должен допускать «идентифицируемых подмножеств», которые подразумевают другой уровень достоверности. В большинстве (если не во всех) контрпримерах у нас есть случаи, когда существуют идентифицируемые подмножества, которые имеют разные вероятности покрытия.

В этих случаях вы можете либо использовать байесовские кредитные интервалы, чтобы указать субъективный смысл того, где находится параметр, либо вы можете сформулировать интервал вероятности, чтобы отразить относительную неопределенность в параметре, учитывая данные.

Например, один случай, который кажется относительно свободным от противоречий, - это двусторонний нормальный доверительный интервал для среднего по населению. Предполагая выборку из нормальной популяции с данным стандартным значением, 95% ДИ допускает отсутствие идентифицируемых подмножеств, которые могли бы предоставить больше информации о параметре. Это видно по тому факту, что среднее значение выборки является достаточной статистикой в ​​функции правдоподобия, т. Е. Функция правдоподобия не зависит от значений отдельных выборок, когда мы знаем среднее значение выборки.

Причина, по которой у нас есть какая-либо субъективная уверенность в 95% симметричном КИ для нормального среднего, меньше связана с заявленной вероятностью охвата, а больше - с тем фактом, что симметричный 95% КИ для нормального среднего значения является интервалом «наибольшей вероятности», т. Е. Все Значения параметров в пределах интервала имеют более высокую вероятность, чем любое значение параметра вне интервала. Однако, поскольку вероятность не является вероятностью (в смысле долгосрочной точности), это скорее субъективный критерий (как и байесовское использование априора и вероятности). В итоге, существует бесконечное множество интервалов для нормального среднего значения, которые имеют 95% -ную вероятность охвата, но только симметричный CI обладает интуитивной правдоподобностью, которую мы ожидаем из оценки интервала.

Следовательно, критерий Р. А. Фишера подразумевает, что вероятность охвата должна приравниваться к субъективной достоверности, только если она не допускает ни одного из этих идентифицируемых подмножеств. Если подмножества присутствуют, то вероятность покрытия будет зависеть от истинных значений параметра (ов), описывающих подмножество. Чтобы получить интервал с интуитивно понятным уровнем достоверности, вам нужно будет указать интервал оценки в соответствующей вспомогательной статистике, которая помогает идентифицировать подмножество. ИЛИ, вы можете прибегнуть к моделям дисперсии / смеси, что, естественно, приводит к интерпретации параметров как случайных величин (так называемая байесовская статистика), или вы можете рассчитать профиль / условные / предельные вероятности в рамках схемы вероятности. В любом случае, вы отказались от какой-либо надежды придумать объективно проверяемую вероятность быть правильным,

Надеюсь это поможет.

KST
источник
1
(+1) Одним из способов обоснования симметричного нормального КИ является то, что он минимизирует ожидаемую длину. В конечном счете, это просто подталкивает субъективность к выбору длины как функции потерь в процедуре принятия решения: но это, вероятно, «хороший» вид субъективности (потому что она раскрывает роль наших аналитических целей в нашем выборе статистической процедуры), а не «плохая» субъективность, которая звучит просто как некий уничижительный эпитет.
whuber
5

С теоретической точки зрения Вопросы 2 и 3 основаны на неверном допущении, что определения неверны. Поэтому я согласен с ответом @ whuber в этом отношении, и ответ @ whuber на вопрос 1 не требует от меня дополнительной информации.

Тем не менее, с более практической точки зрения доверительный интервал может быть дан в его интуитивном определении (Вероятность содержания истинного значения), когда он численно идентичен байесовскому достоверному интервалу, основанному на той же информации (т.е. неинформативном априорном).

Но это несколько уныло для жесткого антибайесовского алгоритма, потому что для того, чтобы проверить условия, чтобы дать своему КИ интерпретацию, которую он / она хочет дать, они должны выработать байесовское решение, для которого автоматически выполняется интуитивная интерпретация!

Самым простым примером является доверительный интервал в для нормального среднего с известной дисперсией и задним правдоподобным интервалом в .1αx¯±σZα/21αx¯±σZα/2

Я не совсем уверен в условиях, но я знаю, что для интуитивной интерпретации КИ важно придерживаться следующего:

1) существует статистика Pivot, распределение которой не зависит от параметров (существуют ли точные центры вне нормального распределения и распределения хи-квадрат?)

2) нет никаких неприятных параметров (за исключением случая Pivotal-статистики, который является одним из немногих точных способов обработки неприятных параметров при создании КИ)

3) существует достаточная статистика для интересующего параметра, и доверительный интервал использует достаточную статистику

4) выборочное распределение достаточной статистики и апостериорное распределение имеют некоторую симметрию между достаточной статистикой и параметром. В нормальном случае распределение выборки симметрии находится в то время как .(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

Эти условия обычно трудно найти, и обычно быстрее вычислить байесовский интервал и сравнить его. Интересным упражнением может быть также попытка ответить на вопрос "для чего мой CI является также Credible Interval?" Вы можете узнать некоторые скрытые предположения о вашей процедуре CI, посмотрев на это ранее.

probabilityislogic
источник
1
(+1) Есть ли действительно такой человек, как «антибайесовский»? :-)
whuber
6
@whuber Вот один из них . А вот эконометрист, который сотрудничает с ней в области философии статистики.
Cyan
1
Спасибо! Это чрезвычайно интересная тема в философии вероятности и статистики, о которой я не знал.
whuber
1
Вы неправильно написали как отсутствующие ? x¯±zα/2σnn
qazwsx
3

Это вещь, которая может быть трудно понять:

  • если в среднем 95% всех доверительных интервалов будет содержать параметр
  • и у меня есть один определенный доверительный интервал
  • почему не вероятность того, что этот интервал содержит параметр также 95%?

Доверительный интервал относится к процедуре отбора проб. Если вы возьмете много выборок и рассчитаете 95% доверительный интервал для каждой выборки, вы обнаружите, что 95% этих интервалов содержат среднее значение по совокупности.

Это полезно, например, для отделов промышленного качества. Эти ребята берут много образцов, и теперь у них есть уверенность, что большинство их оценок будут довольно близки к реальности. Они знают, что 95% их оценок довольно хороши, но они не могут сказать это о каждой конкретной оценке.

Сравните это с бросающими кубиками: если бы вы бросили 600 (справедливых) кубиков, сколько бы 6 бросили? Ваше лучшее предположение - * 600 = 100.16

Однако, если вы бросили ОДИН кубик, бесполезно говорить: «С вероятностью 1/6 или 16,6% я теперь бросил 6». Почему? Потому что кубик показывает либо 6, либо какую-то другую фигуру. Вы бросили 6 или нет. Таким образом, вероятность равна 1 или 0. Вероятность не может быть .16

На вопрос перед броском, какова вероятность броска 6 с ОДНЫМ кубиком, байесовец ответил бы " " (основываясь на предварительной информации: все знают, что у кубика есть 6 сторон и равный шанс падать на кого-либо из них), но Frequentist сказал бы «Не знаю», потому что частота основана исключительно на данных, а не на априорных или какой-либо внешней информации.16

Аналогичным образом, если у вас есть только 1 выборка (таким образом, 1 доверительный интервал), вы не сможете сказать, насколько вероятно, что среднее значение популяции находится в этом интервале. Среднее (или любой параметр) либо в нем, либо нет. Вероятность равна либо 1, либо 0.

Кроме того, неверно, что значения в пределах доверительного интервала более вероятны, чем значения за пределами этого. Я сделал небольшую иллюстрацию; все измеряется в ° C. Помните, что вода замерзает при 0 ° C и кипит при 100 ° C.

Случай: в холодном озере мы бы хотели оценить температуру воды, которая течет ниже льда. Мы измеряем температуру в 100 местах. Вот мои данные:

  • 0,1 ° C (измерено в 49 местах);
  • 0,2 ° C (также в 49 местах);
  • 0 ° C (в 1 месте. Это была вода, которая вот- вот замерзнет);
  • 95 ° C (в одном месте есть фабрика, которая незаконно сбрасывает очень горячую воду в озеро).
  • Средняя температура: 1,1 ° С;
  • Стандартное отклонение: 1,5 ° С;
  • 95% -CI: (-0,8 ° C ...... + 3,0 ° C).

Температуры в этом доверительном интервале определенно НЕ более вероятны, чем вне его. Средняя температура текущей воды в этом озере не может быть ниже 0 ° C, иначе это будет не вода, а лед. Часть этого доверительного интервала (а именно, секция от -0,8 до 0) на самом деле имеет 0% вероятности содержания истинного параметра.

В заключение: доверительные интервалы являются частым понятием, и поэтому основаны на идее повторных выборок. Если многие исследователи будут брать образцы из этого озера, и если все эти исследователи будут рассчитывать доверительные интервалы, то 95% этих интервалов будут содержать истинный параметр. Но для одного доверительного интервала невозможно сказать, насколько вероятно, что он содержит истинный параметр.

Питер Хогендорн
источник
1
Не путайте тот факт, что статистика частых не измеряет веру, когда частый человек имеет предварительные убеждения и обновляет их. Разница заключается не в том, является ли частик идиотом, не обладающим знаниями за пределами данных, а в том, предоставляют ли статистика часто прямые измерения состояний веры. Частые должны обновлять свои убеждения на основе тестов, КИ и т. Д. В противном случае вся их система не работает, потому что все зависит от принятых решений.
Джон
2

Хорошо, я понимаю, что когда вы вычисляете 95% доверительный интервал для параметра, используя классические методы частых ответов, это не означает, что есть 95% вероятность того, что параметр находится в этом интервале. И все же ... когда вы подходите к проблеме с байесовской точки зрения и рассчитываете 95% вероятный интервал для параметра, вы получаете (при условии неинформативного априорного) точно такой же интервал, который вы получаете, используя классический подход. Так что , если я использую классические статистические данные для расчета 95% доверительного интервала (скажу) среднему значению набора данных, то это правда , что есть вероятность того , 95% , что параметр находится в этом интервале.

Ringold
источник
5
Получите ли вы тот же результат, используя частые доверительные интервалы и байесовские достоверные интервалы, зависит от проблемы и, в частности, от предыдущего распределения, используемого в байесовском подходе. Также важно в математике и естествознании, что, когда вы правы, вы правы по правильной причине!
Дикран Marsupial
4
Если вы «используете классическую статистику для расчета 95% доверительного интервала для [параметра]», то, если вы последовательно рассуждаете, бессмысленно ссылаться на «вероятность того, что параметр находится в этом интервале». В тот момент, когда вы упоминаете эту вероятность, вы изменили свою статистическую модель ситуации. В новой модели, где параметр является случайным, неправильно вычислять КИ с использованием методов частых посещений. Получение правильного ответа таким способом в некоторых ситуациях интересно, но не оправдывает концептуальную путаницу, лежащую в основе этого.
whuber
4
@whuber - ваша посылка «... если вы рассуждаете последовательно ...» вытекает из старой доброй теоремы Кокса. В нем говорится, что если вы последовательно рассуждаете, то ваше решение должно быть математически эквивалентно байесовскому. Таким образом, учитывая эту предпосылку, CI обязательно будет эквивалентен вероятному интервалу, и его интерпретация как вероятности является допустимой. И в Байесе, это не параметр, который имеет распределение, это неопределенность в отношении того параметра, который имеет распределение.
вероятностная
2
... продолжение ... Так что можно играть в глупую игру: я байесовский "Вероятно, что параметр находится в интервале", я частый "Вероятность того, что интервал охватывает параметр", я байесовский ..., я частый, ..., я байесовский ..., я частый, ..... все время числа фактических вычислений никогда не меняются
вероятностная
2

Вы спрашиваете о доверительном интервале Frequentist . Определение (обратите внимание, что ни одно из ваших 2 цитирований не является определением! Только утверждения, которые оба являются правильными):

Если бы я повторил этот эксперимент большое количество раз, учитывая эту подобранную модель со значениями этого параметра , в 95% экспериментов расчетное значение параметра попадало бы в этот интервал.

Таким образом, у вас есть модель (построенная с использованием данных наблюдений) и ее оценочные параметры. Затем, если вы сгенерировали несколько гипотетических наборов данных в соответствии с этой моделью и параметрами, предполагаемые параметры попадут в доверительный интервал.

Так что на самом деле этот частый подход использует модель и оценочные параметры как фиксированные, как указано, и рассматривает ваши данные как неопределенные - как случайную выборку из множества других возможных данных.

Это действительно трудно интерпретировать , и это часто используются в качестве аргумента для байесовской статистики ( который я думаю , что иногда может быть немного спорны . Байесовский статистик с другой стороны принимает данные в виде фиксированных и трактуют параметры как неопределенные. Байесовские правдоподобные интервалы являются затем на самом деле интуитивно понятный, как и следовало ожидать: байесовские достоверные интервалы - это интервалы, в которых с 95% лежит реальное значение параметра.

Но на практике многие люди интерпретируют частые доверительные интервалы так же, как байесовские достоверные интервалы, и многие статистики не считают это большой проблемой - хотя они все знают, что это не на 100% правильно. Кроме того, на практике интервалы между частотой и байесовской достоверностью / достоверностью не будут сильно отличаться при использовании байесовских неинформативных априорных значений .

любознательный
источник
-1 Ваше «определение» кажется неверным, по крайней мере, в одном его чтении. - ДИ сконструирована так, чтобы покрыть истинный параметр с вероятностью . Это не зависит от конкретной модели или метода подбора параметров. Возможно, я неверно истолковываю определение: я использую «подобранную модель с этим значением параметра», чтобы сослаться на вашу текущую оценку параметра. Если это не так, как вы хотели, возможно, вы могли бы прояснить этот момент? 1α1α
whuber
@ whuber, хорошо, я понимаю, но если вы говорите, что мое определение неверно, пожалуйста, опубликуйте свое полное определение CI.
Любопытно
Я уточнил свой комментарий, Томас, потому что мне пришло в голову, что я могу читать твоё определение так, как ты не собирался. Кифер, « Введение в статистический вывод» , пишет: «[T] результат эксперимента - ... [S]. Используется процедура , используемая для оценки и истинного значения is ... [T] количество .. . Число называется коэффициентом достоверности процедуры ... и называется aXt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)ttдоверительный интервал. "
whuber
@whuber, ваше определение действительно непонятно для меня, и я боюсь, что для большинства людей тоже :) И да, я имел в виду текущую оценку, поскольку частый получит оценку параметра как данность и данные как случайные, противоположные байесовскому.
Любопытно
3
Я думаю, что основная проблема в вашем определении Curious заключается в том, что «... оценочное значение параметра попадет в этот интервал». Это не оценочный параметр, а неизвестный фиксированный параметр; и он не попадает в интервал, скорее интервал перемещается, и 95% времени фиксирует параметр.
Джон
2

Предположим, мы находимся в простой ситуации. У вас есть неизвестный параметр и - оценка которая имеет неточность около 1 (неофициально). Вы думаете (неофициально) должен быть в чаще всего.θTθθ[T1;T+1]

В реальном эксперименте вы наблюдаете .T=12

Естественно задать вопрос «Учитывая то, что я вижу ( ), какова вероятность ?». Математически: . Все естественно задают этот вопрос. Теория доверительных интервалов должна логически ответить на этот вопрос. Но это не так.T=12θ[11;13]P(θ[11;13]|T=12)

Байесовская статистика действительно отвечает на этот вопрос. В байесовской статистике вы действительно можете рассчитать . Но вам нужно принять предшествующий , что это распределение для , прежде чем делать эксперимент и наблюдение . Например :P(θ[11;13]|T=12)θT

  • Предположим, что имеет предыдущую униформу распределения наθ[0;30]
  • сделать этот эксперимент, найтиT=12
  • Применим формулу Байеса:P(θ[11;13]|T=12)=0.94

Но в статистике частых случаев нет никакого предшествующего и, следовательно, ничего подобного не существует. Вместо этого статистики говорят что-то вроде этого: «Каким бы ни был , вероятность того, что равна ". Математически: "P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

Так :

  • Байесовский: дляP(θ[T1;T+1]|T)=0.94T=12
  • Частый участник:θ,P(θ[T1;T+1]|θ)=0.95

Байесовское утверждение более естественно. Чаще всего частое утверждение спонтанно неверно истолковывается как байесовское утверждение (любым нормальным человеческим мозгом, который годами не занимался статистикой). И, честно говоря, многие статистические книги не дают четкого представления об этом.

А практически?

Во многих обычных ситуациях факт заключается в том, что вероятности, полученные с помощью частотного и байесовского подходов, очень близки. Так что запутанное частое утверждение для байесовского имеет небольшие последствия. Но «философски» это совсем другое.

Бенуа Санчес
источник