Примечание: заранее извиняюсь, если это дубликат, я не нашел аналогичного q в своем поиске
Скажем, у нас есть истинный параметр р. Доверительный интервал C (X) - это RV, который содержит p, скажем, 95% времени. Теперь предположим, что мы наблюдаем X и вычисляем C (X). Общий ответ, по-видимому, состоит в том, что неверно интерпретировать это как наличие «95% -ной вероятности содержания p», поскольку «оно содержит или не содержит p»
Однако, скажем, я выбираю карту из верхней части перемешанной колоды и оставляю ее лицом вниз. Интуитивно я думаю, что вероятность того, что эта карта будет тузом пик, равна 1/52, хотя на самом деле «она есть или не является тузом пик». Почему я не могу применить это рассуждение к примеру доверительного интервала?
Или, если не имеет смысла говорить о «вероятности» того, что карта является тузом пик, поскольку она «есть или нет», я бы все равно оставила шансы 51: 1, что это не туз пик. Есть ли другое слово, чтобы описать эту информацию? Чем эта концепция отличается от «вероятности»?
редактировать: может быть, чтобы быть более ясным, из байесовской интерпретации вероятности, если мне скажут, что случайная переменная содержит p 95% времени, учитывая реализацию этой случайной переменной (и никакой другой информации для условия) Правильно ли сказать, что случайная величина с вероятностью 95% содержит р?
Отредактируйте также: из частной интерпретации вероятности, скажем, участник соглашается не говорить ничего подобного «существует 95% вероятность того, что доверительный интервал содержит p». По-прежнему ли логично, чтобы частый человек имел «уверенность» в том, что доверительный интервал содержит р?
Пусть альфа будет уровнем значимости, а t = 100-альфа. K (t) - «уверенность» частого лица в том, что доверительный интервал содержит p. Имеет смысл увеличить K (t) по t. Когда t = 100%, частый участник должен иметь уверенность (по определению), что доверительный интервал содержит p, поэтому мы можем нормализовать K (1) = 1. Аналогично, K (0) = 0. Предположительно, K (0,95) находится где-то между 0 и 1 и K (0,999999) больше. Как частый участник будет считать K отличным от P (распределение вероятностей)?
источник
Ответы:
Я думаю, что многие традиционные объяснения этого вопроса не ясны.
Допустим, вы берете образец размером и получаете 95 % доверительный интервал для р100 95% p .
Затем вы берете другую выборку из , независимо от первой, и получаете еще 95 % доверительный интервал для p100 95% p .
Что меняется, так это доверительный интервал; что не меняется, так это .p Это означает, что в частых методах говорят, что доверительный интервал «случайный», но p «фиксированный» или «постоянный», то есть не случайный. В распространенных методах, таких как метод доверительных интервалов, вероятности назначаются только случайным вещам.
Поэтому и ( L , U ) - доверительный интервал. ( L = "нижний" и U = "верхний".) Возьмите новый образец и LPr(L<p<U)=0.95 (L,U) L= U= L и изменятся, а p - нет.U p
Допустим, в конкретном случае у вас и U = 43,61 . В частых методах нельзя назначать вероятность утверждению 40.53 < p < 43.61 , кроме вероятности 0 или 1 , потому что здесь нет ничего случайного: 40.53 не является случайным,L=40.53 U=43.61 40.53<p<43.61 0 1 40.53 не является случайным (поскольку оно не изменится, если мы берем новый образец), и 43,61 не случайно.p 43.61
На практике, люди ведут себя так , как будто они уверены , что р между 40.53 и 43.61 . И на практике это часто имеет смысл. Но иногда это не так. Одним из таких случаев является случай, когда заранее известно, что числа, превышающие 40 или более, маловероятны или если они известны как весьма вероятные. Если кто-то может присвоить некоторое предыдущее распределение вероятностей для p , то он использует теорему Байеса для получения достоверного интервала, который может отличаться от доверительного интервала из-за предварительного знания того, какие диапазоны значений p95% p 40.53 43.61 40 p p вероятны или маловероятны. Может также случиться так, что сами данные - то, что меняется при взятии новой выборки, могут сказать вам, что вряд ли будет или даже не будет таким большим, как 40 . Это может случиться даже в тех случаях, когда пара ( L , U ) является достаточной статистикой для p & thetas ; & plusmn ; 1 / 2p 40 (L,U) p , С этим явлением можно справиться в некоторых случаях с помощью метода обусловленности Фишера на вспомогательной статистике. Примером этого последнего явления является случай, когда выборка состоит только из двух независимых наблюдений, которые равномерно распределены в интервале . Тогда интервал от меньшего из двух наблюдений до большего составляет 50 % доверительный интервал. Но если расстояние между ними равно 0,001 , было бы абсурдно быть где-то на 50 % уверенным, что θ находится между ними, а если расстояние составляет 0,999 , можно было бы с уверенностью сказать , что почти на 100 %θ±1/2 50% 0.001 50% θ 0.999 100% находится между ними. Расстояние между ними будет вспомогательной статистикой, на которую можно рассчитывать.θ
источник
Учебное определение доверительного интервала :100×(1−α)
Для тех, кто часто посещает этот семинар, вероятность заключается в том, что понятие «перематывать время и пространство» повторяет результаты, как если бы было создано бесконечное количество копий мира, чтобы снова и снова оценивать научные открытия. Так что вероятность - это частота точно. Для ученых это очень удобный способ обсуждения результатов, так как первый научный принцип заключается в том, что исследования должны воспроизводиться.
В примере с вашей картой путаница для байесов и частых пользователей заключается в том, что частый участник не присваивает вероятность номинальной стоимости конкретной карты, которую вы сбросили из колоды, тогда как байесовский будет. Назначит частотный вероятность в карты, перевернутой из верхней части случайным образом перемешиваются палубе. Байесовец не заинтересован в воспроизведении исследования: после переворачивания карты вы теперь на 100% уверены в том, что это за карта, и на 0% уверены, что она может принять любое другое значение. Для байесов вероятность является мерой веры.
Обратите внимание, что байесовцы не имеют доверительных интервалов по этой причине, они суммируют неопределенность с интервалами достоверности .
источник