Если вероятный интервал имеет ровный априор, равен ли доверительный интервал 95% доверительному интервалу 95%?

31

Я очень плохо знаком с байесовской статистикой, и это может быть глупым вопросом. тем не менее:

Рассмотрим вероятный интервал с априором, который определяет равномерное распределение. Например, от 0 до 1, где от 0 до 1 представляет полный диапазон возможных значений эффекта. В этом случае будет ли доверительный интервал 95% равным доверительному интервалу 95%?

Pomodoro
источник

Ответы:

23

Многие частые доверительные интервалы (ДИ) основаны на функции вероятности. Если предшествующее распределение действительно неинформативно, то байесовский апостериор имеет по существу ту же информацию, что и функция правдоподобия. Следовательно, на практике байесовский интервал вероятности (или вероятный интервал) может быть в числовом отношении очень похож на частый доверительный интервал. [Конечно, даже если численно схожи, существуют философские различия в интерпретации между частыми и байесовскими интервальными оценками.]

Вот простой пример, оценивающий вероятность биномиального успеха Предположим, что у нас наблюдений (испытаний) с успехами.n = 100 X = 73θ.n=100X=73

Частый: Традиционный интервал Вальда использует точечную оценку И 95% -й КИ имеет форму которая вычисляется в& Thetas ; & plusmn1,96θ^=X/n=73/100=0.73.(0,643,

θ^±1.96θ^(1θ^)n,
(0.643,0.817).
n = 100;  x = 73;  th.w = x/n;  pm = c(-1,1)
ci.w = th.w + pm*1.96*sqrt(th.w*(1-th.w)/n);  ci.w
[1] 0.6429839 0.8170161

Эта форма CI предполагает, что соответствующие биномиальные распределения могут быть аппроксимированы нормальными и что предел погрешности хорошо аппроксимируется В особенности для малых эти предположения не обязательно должны быть верными. [Случаи, когда или , особенно проблематичны.]θ(1θ)/nn,X=0X=nθ^(1θ^)/n.n,X=0X=n

Агрести-Коулл CI было показано , чтобы иметь более точную вероятность охвата. Этот интервал «добавляет два успеха и два отказа» как трюк, чтобы приблизить вероятность покрытия к 95%. Она начинается с точечной оценки где Тогда 95% -й КИ имеет вид который вычисляется вДля и разница между этими двумя стилями доверительных интервалов практически ничтожна. ~ п +4. ~ & thetas ; & plusmn1,96θ~=(X+2)/n~,n~+4.(0,612,0,792). п>1000.3<~θ<0,7,

θ~±1.96θ~(1θ~)n~,
(0.612,0.792).n>1000.3<θ~<0.7,
ci.a = th.a + pm*1.96*sqrt(th.a*(1-th.a)/n);  ci.a
[1] 0.6122700 0.7915761

Байесовский: один популярный неинформативный априор в этой ситуации - этоФункция правдоподобия пропорциональна Умножая ядра априора и вероятности, мы получаем ядро ​​апостериорного распределения θ x ( 1 - θ ) n - x . B e t a ( x + 1 ,Beta(1,1)Unif(0,1).θx(1θ)nx.Beta(x+1,nx+1).

Затем для оценки байесовского интервала 95% используются квантили 0,025 и 0,975 апостериорного распределения для получения Когда предыдущее распределение является «плоским» или «неинформативным», числовая разница между байесовским вероятностным интервалом и доверительным интервалом Агрести-Кулла незначительна.(0.635,0.807).

qbeta(c(.025, .975), 74, 28)
[1] 0.6353758 0.8072313

Примечания: (a) В этой ситуации некоторые байесовцы предпочитают неинформативный априорный(b) Для уровней достоверности, отличных от 95%, Agresti-Coull CI использует немного другую точечную оценку. (c) Для данных, отличных от биномиальных, может не быть доступного «плоского» априора, но можно выбрать априор с огромной дисперсией (малой точностью), который несет очень мало информации. (d) Для более подробного обсуждения КИ Agresti-Coull, графиков вероятностей покрытия и некоторых ссылок, возможно, также посмотрите эти вопросы и ответы .Beta(.5,.5).

BruceET
источник
10

Ответ BruceET отличный, но довольно длинный, поэтому вот краткое практическое резюме:

  • если предшествующий является плоским, вероятность и задний имеют одинаковую форму
  • интервалы, однако, не обязательно одинаковы, потому что они построены по-разному. Стандартный байесовский 90% CI покрывает центральные 90% задней части. Частота CI обычно определяется точечным сравнением (см. Ответ BruceET). Для неограниченного параметра местоположения (например, оценки среднего нормального распределения) разница обычно невелика, но если вы оцениваете ограниченный параметр (например, биномиальное среднее) близко к границам (0/1), различия могут быть существенными.
  • Конечно, интерпретация тоже другая, но я интерпретирую вопрос главным образом как «когда значения будут одинаковыми?»
Флориан Хартиг
источник
9

Хотя для априора можно решить, который дает достоверный интервал, равный доверительному доверительному интервалу, важно понимать, насколько узкой является область применения. Все обсуждение предполагает, что размер выборки был фиксированным и не является случайной величиной. Предполагается, что был только один взгляд на данные, и что последовательный вывод не был сделан. Предполагается, что была только одна зависимая переменная, а другие параметры не представляли интереса. Там, где есть кратности, байесовские и частые интервалы расходятся (байесовские апостериорные вероятности находятся в режиме прогнозирования прямого времени и не должны учитывать «как мы сюда попали», поэтому не имеют никакого способа или необходимости корректировать множественные взгляды). К тому же,

Фрэнк Харрелл
источник
Что значит быть в «режиме прогнозирования времени вперёд» и почему нам не нужно учитывать эффекты выбора или множественности?
Badmax
1
Смотрите это . Подумайте о прогнозировании победителя футбольного матча по ходу игры. Ваша текущая вероятность того, что команда x выиграет игру, может полностью игнорировать ваши прошлые прогнозы. Но если вы работаете в режиме частых игр, вам придется предугадывать, сколько раз ваша команда проигрывает игру, и учитывать крайние значения во всех точках игры, на которые вы склонны делать прогнозы. Кратность исходит из шансов, что вы даете данные, чтобы быть экстремальными, и это учитывает только частые вычисления.
Фрэнк Харрелл
6

Правдоподобие байесовский с плоским до

Функция правдоподобия и связанный с ней доверительный интервал не совпадают (концепция) с байесовской апостериорной вероятностью, построенной с априором, который задает равномерное распределение.

В частях 1 и 2 этого ответа утверждается, почему вероятность не следует рассматривать как байесовскую апостериорную вероятность, основанную на плоском априоре.

В части 3 приведен пример, в котором доверительный интервал и вероятный интервал широко варьируются. Также указывается, как возникает это несоответствие.

1 Разное поведение при преобразовании переменной

Вероятности трансформируются особым образом . Если мы знаем распределение вероятности то мы также знаем распределение для переменной определенной любой функцией , согласно правилу преобразования:fx(x)fξ(ξ)ξx=χ(ξ)

fξ(ξ)=fx(χ(ξ))dχdξdξ

Если вы преобразуете переменную, то среднее значение и режим могут отличаться из-за этого изменения функции распределения. Это означает, что и .x¯χ(ξ¯)xmaxf(x)χ(ξmaxf(ξ))

Функция правдоподобия не преобразуется таким образом . Это контрасты между функцией правдоподобия и апостериорной вероятностью. Функция правдоподобия (максимум) остается неизменной при преобразовании переменной.

Lξ(ξ)=Lx(χ(ξ))

Связанный:

  • Плоский априор неоднозначен . Это зависит от формы конкретной статистики.

    Например, если равномерна распределена (например , то является не однородным распределенным переменным.XU(0,1))X2

    Не существует ни одной квартиры до, с которой вы могли бы связать функцию правдоподобия. Он отличается , когда вы определяете плашмя перед для или некоторые преобразованные переменной как . По всей вероятности, такой зависимости не существует.XX2

  • Границы вероятностей (интервалы вероятности) будут разными при преобразовании переменной (для функций правдоподобия это не так) . Например, для некоторого параметра и монотонного преобразования (например, логарифм) вы получаете эквивалентные интервалы правдоподобия af(a)мин <

    amin<a<amaxf(amin)<f(a)<f(amax)

2 Другая концепция: доверительные интервалы не зависят от предыдущих

Предположим, вы выбираете переменную из совокупности с (неизвестным) параметром которая сама (совокупность с параметром ) отбирается из суперпопуляции (возможно, с различными значениями для ).Xθθθ

Можно сделать обратное утверждение пытается сделать вывод о том , что оригинал , возможно, был основан на наблюдение некоторых значений для переменной .θxiX

  • Байесовская метода сделать это, допуская априорное распределение для распределения возможныхθ
  • Это контрастирует с функцией правдоподобия и доверительным интервалом, которые не зависят от предыдущего распределения.

Доверительный интервал не использует информацию априора, как достоверный интервал (достоверность не является вероятностью).

Независимо от предшествующего распределения (равномерное или нет) интервал x% -доверности будет содержать истинный параметр в случаевx (доверительные интервалы относятся к коэффициенту успеха, ошибке I типа, метода, а не конкретного случая) ,

В случае вероятного интервала это понятие ( времени, в котором интервал содержит истинный параметр) даже не применимо, но мы можем интерпретировать его в частом смысле, а затем мы видим, что вероятный интервал будет содержать только истинный параметр времени, когда (равномерное) предшествующее значение правильно описывает суперпопуляцию параметров, с которыми мы можем столкнуться. Интервал может эффективно работать выше или ниже, чем x% (не то, чтобы это имело значение, поскольку байесовский подход отвечает на разные вопросы, но это просто для того, чтобы отметить разницу).x

3 Разница между доверием и достоверными интервалами

В приведенном ниже примере мы исследуем функцию правдоподобия для экспоненциального распределения как функцию параметра скорости , среднего значения выборки и размера выборки :λx¯n

L(λ,x¯,n)=nn(n1)!xn1λneλnx¯

эта функция выражает вероятность наблюдать (для данного и ) выборочное среднее между и .nλx¯x¯+dx

примечание: параметр скорости изменяется от до (в отличие от OP 'request' от до ). Приор в этом случае будет ненадлежащим приором . Принципы, однако, не меняются. Я использую эту перспективу для упрощения иллюстрации. Распределения с параметрами от до часто являются дискретными (трудно рисовать непрерывные линии) или бета-распределением (сложно рассчитать)λ00101

Изображение ниже иллюстрирует эту функцию правдоподобия (карта синего цвета) для размера выборки , а также рисует границы для интервалов 95% (как достоверных, так и достоверных).n=4

Разница между достоверными и доверительными интервалами

Границы создаются с получением (одномерной) кумулятивной функции распределения. Но эта интеграция / накопление может быть сделано в двух направлениях .

Разница между интервалами происходит потому, что 5% площади сделаны по-разному.

  • 95-процентный доверительный интервал содержит значения для которых наблюдаемое значение встречается как минимум в 95% случаев. Этим способом. Независимо от значения , мы ошиблись бы только в 95% случаев.λx¯λ

    Для любой вас есть север и юг от границ (изменение ) 2,5% от веса функции правдоподобия.λx¯

  • Доверительный интервал 95% содержит значения которые, скорее всего, вызывают наблюдаемое значение (с учетом предшествующего фиксированного значения)λx¯

    Даже когда наблюдаемый результат менее чем на 5% вероятен для данного , конкретный может находиться внутри вероятного интервала. В конкретном примере более высокие значения являются «предпочтительными» для вероятного интервала.x¯λλλ

    Для любого вас есть запад и восток от границ (изменение ) 2,5% от веса функции правдоподобия.x¯λ

Случай, когда доверительный интервал и вероятный интервал (на основе неправильного априорного значения) совпадают, предназначен для оценки среднего значения гауссовой распределенной переменной (распределение показано здесь: https://stats.stackexchange.com/a/351333/164061 ).

Очевидный случай, когда доверительный интервал и вероятный интервал не совпадают, иллюстрируется здесь ( https://stats.stackexchange.com/a/369909/164061 ). Доверительный интервал для этого случая может иметь одну или даже обе (верхнюю / нижнюю) границы на бесконечности.

Секст Эмпирик
источник
2
Не говорите, содержит ли достоверный интервал истинный параметр. Достоверный интервал делает утверждение вероятности. И x% для доверительного интервала необходимо указать, что означает репликация, то есть, что такое «случаи».
Фрэнк Харрелл
Первая пуля - почему некоторые байесовцы предпочитают более как указано в примечании в конце моей проблемы. // интервалы Вальда не обеспечивают заявленный уровень покрытия из-за используемых приближений. (Не точно основано на вероятности.)Beta(.5,.5)
BruceET
Я не верю, что сказал, что при плоской априорной вероятности задняя вероятность, хотя это может иметь место. В соответствии с написанием ответа на уровне, который я должен был представлять на уровне ОП, я старался тщательно написать первый абзац своего Ответа. Верите ли вы в то, что я сказал, на самом деле неправильно, или вы говорите, что это может быть неправильно истолковано?
Брюс
1

Обычно это не так, но может показаться так из-за наиболее часто рассматриваемых особых случаев.

РассмотримИнтервал - это доверительный интервал для хотя и не тот, который использовал бы кто-либо со здравым смыслом. Он не совпадает с вероятным интервалом в от апостериорной плоскости до априорной.( минимум { X , Y } , максимум { X , Y } ) 50 % θ , 50 %X,Yi.i.dUniform[θ1/2,θ+1/2].(min{X,Y},max{X,Y})50%θ,50%

Техника обусловленности Фишера на вспомогательной статистике в этом случае дает доверительный интервал, который совпадает с этим вероятным интервалом.

Майкл Харди
источник
0

Из моего чтения я подумал, что это утверждение верно асимптотически, то есть для большого размера выборки, и если кто-то использует неинформативный априор.

Простой числовой пример, казалось бы, подтверждает это - интервалы максимального правдоподобия профиля 90% и доверительные интервалы 90% биномиального GLM ML и байесовского GLM действительно практически идентичны n=1000, хотя расхождение станет большим для малых n:

# simulate some data
set.seed(123)
n = 1000                     # sample size
x1 = rnorm(n)                # two continuous covariates 
x2 = rnorm(n)
z = 0.1 + 2*x1 + 3*x2        # predicted values on logit scale
y = rbinom(n,1,plogis(z))    # bernoulli response variable
d = data.frame(y=y, x1=x1, x2=x2)

# fit a regular GLM and calculate 90% confidence intervals
glmfit = glm(y ~ x1 + x2, family = "binomial", data = d)
library(MASS)
# coefficients and 90% profile confidence intervals :
round(cbind(coef(glmfit), confint(glmfit, level=0.9)), 2) 
#                      5 % 95 %
#   (Intercept) 0.00 -0.18 0.17
# x1            2.04  1.77 2.34
# x2            3.42  3.05 3.81

# fit a Bayesian GLM using rstanarm
library(rstanarm)
t_prior = student_t(df = 3, location = 0, scale = 100) # we set scale to large value to specify an uninformative prior
bfit1 = stan_glm(y ~ x1 + x2, data = d, 
                 family = binomial(link = "logit"), 
                 prior = t_prior, prior_intercept = t_prior,  
                 chains = 1, cores = 4, seed = 123, iter = 10000)
# coefficients and 90% credible intervals :
round(cbind(coef(bfit1), posterior_interval(bfit1, prob = 0.9)), 2) 
#                        5%  95%
#   (Intercept) -0.01 -0.18 0.17
# x1             2.06  1.79 2.37
# x2             3.45  3.07 3.85


# fit a Bayesian GLM using brms
library(brms)
priors = c(
  prior(student_t(3, 0, 100), class = "Intercept"),
  prior(student_t(3, 0, 100), class = "b")
)
bfit2 = brm(
  y ~ x1 + x2,
  data = d,
  prior = priors,
  family = "bernoulli",
  seed = 123 
) 
# coefficients and 90% credible intervals :
summary(bfit2, prob=0.9)
# Population-Level Effects: 
#           Estimate Est.Error l-90% CI u-90% CI Eff.Sample Rhat
# Intercept    -0.01      0.11    -0.18     0.18       2595 1.00
# x1            2.06      0.17     1.79     2.35       2492 1.00
# x2            3.45      0.23     3.07     3.83       2594 1.00


# fit a Bayesian GLM using arm
library(arm)
# we set prior.scale to Inf to specify an uninformative prior
bfit3 = bayesglm(y ~ x1 + x2, family = "binomial", data = d, prior.scale = Inf) 
sims = coef(sim(bfit3, n.sims=1000000))
# coefficients and 90% credible intervals :
round(cbind(coef(bfit3), t(apply(sims, 2, function (col) quantile(col,c(.05, .95))))),2)
#                       5%  95%
#   (Intercept) 0.00 -0.18 0.17
# x1            2.04  1.76 2.33
# x2            3.42  3.03 3.80

Как видно из приведенного выше примера, для n=100090-процентных доверительных интервалов профиля биномиального GLM практически идентичны 90-процентным доверительным интервалам байесовского биномиального GLM (разница также в пределах использования разных семян и различных Число итераций в байесовских подгонках, и точная эквивалентность также не может быть получена, поскольку указание 100% неинформативного априора также невозможно с помощью rstanarmили brms).

Том Венселерс
источник