Интерпретация доверительного интервала

16

Примечание: заранее извиняюсь, если это дубликат, я не нашел аналогичного q в своем поиске

Скажем, у нас есть истинный параметр р. Доверительный интервал C (X) - это RV, который содержит p, скажем, 95% времени. Теперь предположим, что мы наблюдаем X и вычисляем C (X). Общий ответ, по-видимому, состоит в том, что неверно интерпретировать это как наличие «95% -ной вероятности содержания p», поскольку «оно содержит или не содержит p»

Однако, скажем, я выбираю карту из верхней части перемешанной колоды и оставляю ее лицом вниз. Интуитивно я думаю, что вероятность того, что эта карта будет тузом пик, равна 1/52, хотя на самом деле «она есть или не является тузом пик». Почему я не могу применить это рассуждение к примеру доверительного интервала?

Или, если не имеет смысла говорить о «вероятности» того, что карта является тузом пик, поскольку она «есть или нет», я бы все равно оставила шансы 51: 1, что это не туз пик. Есть ли другое слово, чтобы описать эту информацию? Чем эта концепция отличается от «вероятности»?

редактировать: может быть, чтобы быть более ясным, из байесовской интерпретации вероятности, если мне скажут, что случайная переменная содержит p 95% времени, учитывая реализацию этой случайной переменной (и никакой другой информации для условия) Правильно ли сказать, что случайная величина с вероятностью 95% содержит р?

Отредактируйте также: из частной интерпретации вероятности, скажем, участник соглашается не говорить ничего подобного «существует 95% вероятность того, что доверительный интервал содержит p». По-прежнему ли логично, чтобы частый человек имел «уверенность» в том, что доверительный интервал содержит р?

Пусть альфа будет уровнем значимости, а t = 100-альфа. K (t) - «уверенность» частого лица в том, что доверительный интервал содержит p. Имеет смысл увеличить K (t) по t. Когда t = 100%, частый участник должен иметь уверенность (по определению), что доверительный интервал содержит p, поэтому мы можем нормализовать K (1) = 1. Аналогично, K (0) = 0. Предположительно, K (0,95) находится где-то между 0 и 1 и K (0,999999) больше. Как частый участник будет считать K отличным от P (распределение вероятностей)?

applicative_x
источник
1
Действительно, рассмотрим подбрасывание монеты там, где монета катится под столом, вне поля зрения, и мы рассмотрим случай, когда монета приземлилась на головы. На первый взгляд это кажется очень похожим на проблему CI - очевидно, произошло событие или нет. Тем не менее, в случае с переворотом монеты многие (возможно, даже большинство) часто выглядят совершенно счастливыми, чтобы назначить условную вероятность (скажем, ) для ненаблюдаемой монеты, попавшей на головы, отказываясь сказать то же самое о случайном интервале, содержащем параметр. Мне кажется, что есть несоответствие. p
Glen_b Восстановить Монику
@Glen_b Часто встречающиеся в сценарии ненаблюдаемой брошенной монеты применяют контрфактуальные доводы, чтобы сказать, что фактическая номинальная стоимость монеты является «случайной» (хотя и ненаблюдаемой), но мы можем обобщить любой наблюдаемый результат на другие потенциальные результаты в этом отброшенном монет и рассчитать вероятности. Что касается вероятности фактического номинала монеты, она или есть, или нет, то вероятность не существует. сохраняются для контрфактуального строительства этой установки. p
AdamO
@Glen_b: Я согласен, посмотрите мой вопрос здесь: stats.stackexchange.com/questions/233588/…
vonjd
@vonjd, в какой степени твой вопрос там, а не просто дубликата первого абзаца после открытия «Примечание:» здесь?
Glen_b
@Glen_b: Честно говоря, я не знал об этом вопросе, когда отправлял свои, и они определенно пересекаются. Тем не менее, я думаю, что они не являются дубликатами, потому что моя более широко связана с использованием вероятностей для скрытых результатов (которые будут иметь последствия для доверительных интервалов), тогда как эта цель нацелена исключительно на доверительные интервалы. Но если вы думаете, что мой дубликат, не стесняйтесь закрыть его.
Vonjd

Ответы:

8

Я думаю, что многие традиционные объяснения этого вопроса не ясны.

Допустим, вы берете образец размером и получаете 95 % доверительный интервал для р10095%p .

Затем вы берете другую выборку из , независимо от первой, и получаете еще 95 % доверительный интервал для p10095%p .

Что меняется, так это доверительный интервал; что не меняется, так это . p Это означает, что в частых методах говорят, что доверительный интервал «случайный», но p «фиксированный» или «постоянный», то есть не случайный. В распространенных методах, таких как метод доверительных интервалов, вероятности назначаются только случайным вещам.

Поэтому и ( L , U ) - доверительный интервал. ( L = "нижний" и U = "верхний".) Возьмите новый образец и LPr(L<p<U)=0.95(L,U)L=U=L и изменятся, а p - нет.Up

Допустим, в конкретном случае у вас и U = 43,61 . В частых методах нельзя назначать вероятность утверждению 40.53 < p < 43.61 , кроме вероятности 0 или 1 , потому что здесь нет ничего случайного: 40.53 не является случайным,L=40.53U=43.6140.53<p<43.610140.53 не является случайным (поскольку оно не изменится, если мы берем новый образец), и 43,61 не случайно.p43.61

На практике, люди ведут себя так , как будто они уверены , что р между 40.53 и 43.61 . И на практике это часто имеет смысл. Но иногда это не так. Одним из таких случаев является случай, когда заранее известно, что числа, превышающие 40 или более, маловероятны или если они известны как весьма вероятные. Если кто-то может присвоить некоторое предыдущее распределение вероятностей для p , то он использует теорему Байеса для получения достоверного интервала, который может отличаться от доверительного интервала из-за предварительного знания того, какие диапазоны значений p95%p40.5343.6140ppвероятны или маловероятны. Может также случиться так, что сами данные - то, что меняется при взятии новой выборки, могут сказать вам, что вряд ли будет или даже не будет таким большим, как 40 . Это может случиться даже в тех случаях, когда пара ( L , U ) является достаточной статистикой для p & thetas ; & plusmn ; 1 / 2p40(L,U)p, С этим явлением можно справиться в некоторых случаях с помощью метода обусловленности Фишера на вспомогательной статистике. Примером этого последнего явления является случай, когда выборка состоит только из двух независимых наблюдений, которые равномерно распределены в интервале . Тогда интервал от меньшего из двух наблюдений до большего составляет 50 % доверительный интервал. Но если расстояние между ними равно 0,001 , было бы абсурдно быть где-то на 50 % уверенным, что θ находится между ними, а если расстояние составляет 0,999 , можно было бы с уверенностью сказать , что почти на 100 %θ±1/250%0.00150%θ0.999100% находится между ними. Расстояние между ними будет вспомогательной статистикой, на которую можно рассчитывать.θ

Майкл Харди
источник
Спасибо, Майкл, в этом много смысла. Давайте предположим в вашем примере, что у нас есть определенный (L, U), но значения нам неизвестны. Все, что мы знаем, это то, что это реализация случайной величины с доверительным интервалом 95%. Без каких-либо предварительных данных о параметре или любой другой информации, было бы справедливо установить 19: 1 шансы, что (L, U) содержит параметр? Если частый человек хочет сделать это, но не называет свою «готовность положить 19: 1 шансов, что он содержит параметр« вероятность »», как бы мы это назвали?
Applicative_x
Да, эта вероятность составляет . Конечно, в рамках частых методов можно сказать, что в состоянии незнания ( L , U ) вероятность того, что этот интервал содержит p, равна 0,95 . Но когда кто-то имеет конкретные значения, которые не являются случайными, частый участник не назначит для оператора вероятность, отличную от 0 или 1 , поскольку известные значения L и U не являются случайными. 0.95(L,U)0.95p01LU
Майкл Харди
4

Учебное определение доверительного интервала :100×(1α)

Интервал, который при многих независимых повторениях исследования в идеальных условиях фиксирует измерение воспроизводимого эффекта в % времени.100×(1α)

Для тех, кто часто посещает этот семинар, вероятность заключается в том, что понятие «перематывать время и пространство» повторяет результаты, как если бы было создано бесконечное количество копий мира, чтобы снова и снова оценивать научные открытия. Так что вероятность - это частота точно. Для ученых это очень удобный способ обсуждения результатов, так как первый научный принцип заключается в том, что исследования должны воспроизводиться.

В примере с вашей картой путаница для байесов и частых пользователей заключается в том, что частый участник не присваивает вероятность номинальной стоимости конкретной карты, которую вы сбросили из колоды, тогда как байесовский будет. Назначит частотный вероятность в карты, перевернутой из верхней части случайным образом перемешиваются палубе. Байесовец не заинтересован в воспроизведении исследования: после переворачивания карты вы теперь на 100% уверены в том, что это за карта, и на 0% уверены, что она может принять любое другое значение. Для байесов вероятность является мерой веры.

Обратите внимание, что байесовцы не имеют доверительных интервалов по этой причине, они суммируют неопределенность с интервалами достоверности .

Adamo
источник
Спасибо за ответ. В примере с картой, не согласятся ли байесианец и частик, что 51: 1 - это шансы того, что карта - туз пик? Точно так же, для реализации 95-процентного доверительного интервала (и никакой другой информации) не будет ли вероятность того, что он будет содержать истинный параметр, в обоих случаях 19: 1? В этом смысле, может ли байесовский истолковать 95-процентный доверительный интервал как имеющий 95-процентную вероятность содержать истинный параметр?
Applicative_x
@applicative_x А как насчет колоды pinochle? Вы рассматриваете возможность использования предварительной информации. Может только частотные предположить , что вероятность и использовать только лицо карты valueto сообщить , был ли этот эксперимент согласуется или не согласуются с этой гипотезой. Достоверность любого типа интервальной оценки (достоверность или достоверность) зависит от не поддающихся проверке предположений. Нет такого понятия, как истинный параметр, это опасный способ мышления о науке. Байесовцы не играют с доверительными интервалами согласно более раннему определению. Перечитай ответ. p=1/52
AdamO
Спасибо Адам, я думаю, что все еще в замешательстве. Предположим, я знаю (глядя на карты), что стандартная колода из 52 карт. Я тасую колоду и выбираю топ-10 карт, не глядя на них. Не могу ли я определить «истинный параметр» в этом случае как количество красных карточек? Тогда, независимо от байесовского и частого, существует «истинный параметр». Если мне позволят выбрать 7 карт случайным образом, я мог бы также представить себе доверительный интервал для # красных карточек из моих 10.
Applicative_x
1
Байесовский не должен верить, что нет такой вещи, как истинное значение параметра. Байесианизм просто означает присвоение вероятностей утверждениям, которые являются неопределенными, независимо от того, являются ли они случайными. Байесовский может назначить вероятность к утверждению , что есть жизнь на Марсе миллиарда лет назад. Частик не может этого сделать, поскольку нельзя сказать, что это произошло в половине всех случаев. Ничто в этом не говорит, что байесовец не может поверить, что есть верный ответ на вопрос, была ли такая жизнь на Марсе. Смотрите также мой опубликованный ответ на ваш вопрос. 1/2
Майкл Харди
1
@AdamO: я нахожу ваши комментарии загадочными. «какая польза от понятия« истина »» - это смена субъекта. «Мы считаем истину неизменной». Итак, «мы» означает вас и кого еще, и какова актуальность того, что они думают? «Ни один ученый никогда бы не пошел на сбор данных ради проверки того, что уже известно». Это похоже на очередную смену темы. Затем следуют некоторые комментарии о частых и байесовских. Мне не хочется угадывать, что ты пытаешься сказать.
Майкл Харди