Доверительный интервал для дисперсии с учетом одного наблюдения

25

Это проблема из «7-й Колмогоровской студенческой олимпиады по теории вероятностей»:

Учитывая одно наблюдение из распределения с неизвестными обоими параметрами, задайте доверительный интервал для с уровнем достоверности не менее 99%.Нормальный ( μ , σ 2 ) σ 2XNormal(μ,σ2)σ2

Мне кажется, что это должно быть невозможно. У меня есть решение, но я еще не читал его. Есть предположения?

Я выложу решение через пару дней.

[Последующее редактирование: официальное решение опубликовано ниже. Решение кардинала длиннее, но дает лучший доверительный интервал. Спасибо также Максу и Glen_b за их вклад.]

Джонатан Кристенсен
источник
1
Мне тоже кажется невозможным; Я жду ответа
Питер Флом - Восстановить Монику
1
Проверьте этот сайт .
предположительно нормальное
3
Вот бумага с лучшим форматированием: бумага .
предполагается нормальным
Хех. Я помню, как читал статью об этом материале (один интервал наблюдения) много лет назад. Может быть это одна.
Glen_b
1
@ Макс, спасибо за ссылку! У меня еще не было времени внимательно посмотреть на это, но я буду. Я разместил «официальный» ответ ниже.
Джонатан Кристенсен

Ответы:

17

Если смотреть сквозь призму вероятностных неравенств и связей со случаем многократного наблюдения, этот результат может показаться не таким уж невозможным или, по крайней мере, может показаться более правдоподобным.

Пусть с μ и σ 2 неизвестны. Мы можем записать X = σ Z + μ для Z N ( 0 , 1 ) .X~N(μ,σ2)μσ2Иксзнак равноσZ+μZ~N(0,1)

Основное утверждение : - это ( 1 - α ) доверительный интервал для σ 2, где q α - квантиль α- уровня распределения хи-квадрат с одной степенью свободы. Кроме того, поскольку этот интервал имеет ровно ( 1 - α ) покрытие при μ = 0 , это самый узкий возможный интервал вида [ 0 , b X 2 )[0,Икс2/Qα)(1-α)σ2Qαα (1-α)μзнак равно0[0,бИкс2)для некоторого .бр

Повод для оптимизма

Напомним , что в случая, с Т = Е п I = 1 ( Х я - ˉ Х ) 2 , то типичная ( 1 - α ) доверительный интервал для сг 2 является ( ТN2Tзнак равноΣязнак равно1N(Икся-Икс¯)2 (1-α)σ2 Где Q к , являетсяуровневый квантиль хи-квадрат с K степенями свободы. Это, конечно, верно для любого µ . Хотя этосамый популярныйинтервал (называемый интервалом сравными хвостамипо понятным причинам), он не является ни единственным, ни дажеинтерваломнаименьшей ширины! Как должно быть очевидно, другой действительный выбор ( 0 , T

(TQN-1,(1-α)/2,TQN-1,α/2),
QК,aaКμ
(0,TQN-1,α),

Так, , то ( 0 , Е п я = 1 X 2 ITΣязнак равно1NИкся2 Также имеет покрытие по меньшей мере ( 1 - & alpha ; ) .

(0,Σязнак равно1NИкся2QN-1,α),
(1-α)

В этом свете мы можем быть оптимистичны в том, что интервал в главном утверждении истинен для . Основное отличие состоит в том, что для случая одного наблюдения не существует распределения хи-квадрат с нулевой степенью свободы, поэтому мы должны надеяться, что использование квантиля с одной степенью свободы будет работать.Nзнак равно1

Полшага к нашему месту назначения ( Эксплуатация правого хвоста )

Прежде чем углубиться в доказательство основного утверждения, давайте сначала посмотрим на предварительное утверждение, которое не так сильно или статистически не удовлетворяет, но, возможно, дает некоторое дополнительное понимание происходящего. Вы можете перейти к доказательству основной претензии ниже, без особых (если таковые имеются) потерь. В этом и следующем разделах доказательства, хотя и немного тонкие, основаны только на элементарных фактах: монотонности вероятностей, симметрии и унимодальности нормального распределения.

Дополнительное требование : является ( 1 - α ) доверительный интервал для сг 2 до тех пор , как & alpha ; > 1 / 2 . Здесь z α - квантиль α- уровня стандартной нормали.[0,X2/Zα2)(1-α)σ2α>1/2Zαα

Доказательство . и | σ Z + μ | д = | - σ Z + μ | по симметрии, поэтому в дальнейшем мы можем взять μ 0 без потери общности. Теперь, для & thetas ; 0 и ц 0 , Р ( | Х | > & thetas ; ) Р ( Х > & thetas ; )|Икс|знак равно|-Икс||σZ+μ|знак равноd|-σZ+μ|μ0θ0μ0 И так с θ = г & alpha ; сг , мы видимчто Р ( 0 & le ; сг 2 < Х 2 / г 2 & alpha ; ) 1 - & alpha ;

п(|Икс|>θ)п(Икс>θ)знак равноп(σZ+μ>θ)п(Z>θ/σ),
θзнак равноZασ Это работает только для альфа > 1 / 2 , такэто точто нужно для г α > 0 .
п(0σ2<Икс2/Zα2)1-α,
α>1/2Zα>0

Это доказывает вспомогательное требование. Хотя это показательно, с статистической точки зрения это неутешительно, поскольку для работы требуется абсурдно большое значение .α

Обоснование основной претензии

Уточнение приведенного выше аргумента приводит к результату, который будет работать для произвольного уровня достоверности. Во-первых, отметим, что Положим a = μ / σ 0 и b = θ / σ 0 . Тогда P ( | Z + a | > b ) = Φ ( a - b ) + Φ ( - a - b )

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0 Если мы можем показать, что правая часть увеличивается в a для каждого фиксированного b , то мы можем использовать аргумент, аналогичный предыдущему. Это, по крайней мере, правдоподобно, поскольку мы хотели бы верить, что если среднее значение увеличивается, то становится более вероятным, что мы увидим значение с модулем, который превышает b . (Тем не менее, мы должны следить за тем, как быстро уменьшается масса в левом хвосте!)
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb

Положим . Тогда f b ( a ) = φ ( a - b ) - φ ( - a - b ) = φ ( a - b ) - φ ( a + b )fb(a)=Φ(ab)+Φ(ab) Заметимчто F ' б ( 0 ) = 0 и для положительного U , φ ( U ) убывает по ц . Теперь для a ( 0 , 2 b ) легко видеть, что φ ( a - b ) φ ( - b ) = φ ( b ) . Эти факты, взятые вместе, легко означают, что f b ( a

fb(a)=φ(ab)φ(ab)=φ(ab)-φ(a+б),
еб'(0)знак равно0Uφ(U)Ua(0,2б)φ(a-б)φ(-б)знак равноφ(б) для всех a 0 и любых фиксированных b 0 .
еб'(a)0
a0б0

Таким образом, мы показали , что при 0 и б 0 , Р ( | Z + | > б ) P ( | Z | > б ) = 2 Ф ( - б )a0б0

п(|Z+a|>б)п(|Z|>б)знак равно2Φ(-б),

Распутывая все это, если мы возьмем θзнак равноQασ

п(Икс2>Qασ2)п(Z2>Qα)знак равно1-α,

Заключительное замечание : внимательное прочтение приведенного выше аргумента показывает, что он использует только симметричные и унимодальные свойства нормального распределения. Следовательно, подход работает аналогично для получения доверительных интервалов из одного наблюдения из любого симметричного унимодального семейства масштабов местоположений, например, распределений Коши или Лапласа.

кардинальный
источник
Вот Это Да! а студенты должны выступить с такими аргументами за короткое время олимпиады?
Дилип Сарватэ
1
@Dilip: Понятия не имею! Я не знаком с форматом этой олимпиады или тем, что ожидается с точки зрения решения. Из буквального прочтения я думаю, что ответ Скорчи будет приемлемым. Меня больше интересовало попытка выяснить, как далеко можно зайти с «нетривиальным» решением. Мое собственное (довольно минимальное) исследование следовало тому же ходу мыслей, описанному в ответе (с одним обходным путем). Вполне вероятно, что существует лучшее решение. :-)
кардинал
Это значительно дольше, чем «официальное» решение, но дает лучшую оценку дисперсии, поэтому я отмечаю его как «правильный» ответ. Я разместил «официальный» ответ ниже, а также некоторые результаты моделирования и обсуждения. Спасибо, @cardinal!
Джонатан Кристенсен
2
@ Джонатан: Спасибо. Да, я мог бы сделать доказательство более кратким. Из-за широкого круга участников, присутствующих здесь, я часто склонен заниматься дополнительными (или, возможно, чрезмерными) деталями. :-)
кардинал
12

Время следить за! Вот решение, которое мне дали:

[0,T(Икс))T()

(μр)(σ>0)пμ,σ2(σ2>T(Икс))<0,01.
N(μ,σ2)1/σ2πп(|Икс|a)a/σa0
Tп(|Икс|/σT)знак равноп(Икс2T2σ2)знак равноп(σ2Икс2/T2),
Tзнак равно0,01T(Икс)знак равно10000Икс2,

Доверительный интервал (который является очень широким) является слегка консервативным в моделировании, при этом эмпирическое покрытие (в 100 000 моделированиях) ниже 99,15%, так как я изменял CV на многие порядки.

6300Икс210000Икс2в предоставленном решении. Эмпирическое покрытие прямо на номинальном уровне, опять же на много порядков для CV. Так что его интервал определенно выигрывает.

У меня не было времени внимательно посмотреть на статью Макса, но я планирую посмотреть на нее и могу добавить некоторые комментарии по этому поводу позже (то есть не раньше, чем через неделю). Этот документ претендует на 99% доверительный интервал(0,4900Икс2), который имеет эмпирическое покрытие немного ниже (около 98,85%), чем номинальное покрытие для больших резюме в моих кратких моделированиях.

Джонатан Кристенсен
источник
1
(+1) Это хорошее решение. Если у вас естьT вместо того Tв уравнении дисплея?
кардинал
2
Еще пара моментов: ваше решение может быть сделано очень близко к моему без каких-либо изменений в аргументе. Обратите внимание, что вы можете утверждать, чтоп(|Икс|a)2a/σ2π, Тогда интервал становится(0,2Икс2/πα2) для любого α, С помощьюαзнак равно0,01 доходность T(Икс)6366.198Икс2 по сравнению с 1/Q0,016365.864в моем ответе. Чем выше уровень достоверности (т. Е. Чем меньшеα), чем ближе ваш метод к моему (хотя ваш интервал всегда будет шире).
кардинал
1
Во-вторых, я не смотрел на эту статью, но у меня есть серьезные сомнения в том, что (0,4900Икс2)может быть действительным доверительным интервалом 99%. Действительно, рассмотрим все доверительные интервалы вида(0,бИкс2) для некоторых б, Потом, когдаμзнак равно0у нас есть это Икс2/σ2 точно хи-квадрат с одной степенью свободы и поэтому самый маленький б мы могли бы выбрать в этом случае бзнак равно1/Qα, Другими словами, интервал, указанный в моем ответе, является самой узкой из возможных форм.
кардинал
1
Я сделал (подозреваемый) исправление опечатки. Кроме того, pchisq(1/4900,1,lower.tail=F)в Rрезультатах 0.9886, довольно близко к вашим результатам моделирования для(0,4900Икс2) интервал.
кардинал
1
Спасибо за все комментарии, @cardinal. Я думаю, что ваши изменения верны, хотя я напечатал их так, как это было в оригинальных решениях - опечатка там, я думаю.
Джонатан Кристенсен
5

КИ (0,) предположительно.

Scortchi - Восстановить Монику
источник
1
Я думаю, вам было бы полезно сказать, почему вы не можете получить доверительный интервал конечной длины.
предположительно нормальное
1
@ Макс Я не достаточно умен, но вопрос не задан.
Scortchi - Восстановить Монику
4
+1 за это. Вопрос не говорит о КИ с минимальным охватом, и на самом деле подразумевает, что это может быть приемлемо через его любопытную формулировку, «доверительный интервал с уровнем достоверности не менее 99%».
Ари Б. Фридман