Настоящий смысл уверенного эллипса

12

Читая об истинном значении эллипса с доверительной вероятностью 95%, я, как правило, сталкиваюсь с двумя объяснениями:

  1. Эллипс, который содержит 95% данных
  2. Не выше, но эллипс, который объясняет дисперсию данных. Я не уверен, что правильно понимаю, но они, похоже, означают, что если поступит новая точка данных, есть 95% вероятность того, что новая дисперсия останется в эллипсе.

Можете ли вы пролить свет?

Kenny
источник

Ответы:

15

На самом деле ни одно из объяснений не является правильным.

Доверительный эллипс имеет отношение к ненаблюдаемым параметрам популяции , таким как истинное среднее значение популяции в двумерном распределении. Эллипс с доверительной вероятностью 95% для этого среднего значения на самом деле представляет собой алгоритм со следующим свойством: если бы вам пришлось многократно повторять выборку из базового распределения и каждый раз вычислять доверительный эллипс, то 95% построенных таким образом эллипсов содержали бы базовую диаграмму. жадный. (Обратите внимание, что каждый образец, конечно, даст свой эллипс.)

Таким образом, доверительный эллипс обычно не содержит 95% наблюдений. Фактически, по мере увеличения количества наблюдений среднее значение будет лучше и лучше оцениваться, что приведет к все меньшим и меньшим доверительным эллипсам, которые, в свою очередь, содержат все меньшую долю фактических данных. (К сожалению, некоторые люди вычисляют наименьший эллипс, который содержит 95% их данных, напоминающих квантиль, что само по себе вполне нормально ... но затем продолжают называть этот «квантильный эллипс» «доверительным эллипсом», который, как видите, приводит в замешательство.)

Дисперсия основной популяции относится к эллипсу доверия. Высокая дисперсия будет означать, что данные расположены повсеместно, поэтому среднее значение не очень хорошо оценено, поэтому эллипс достоверности будет больше, чем если бы дисперсия была меньше.

Конечно, мы можем рассчитать доверительные эллипсы также для любого другого параметра популяции, который мы можем пожелать оценить. Или мы могли бы взглянуть на другие доверительные области, кроме эллипсов, особенно если мы не знаем, что предполагаемый параметр (асимптотически) нормально распределен.

Одномерным аналогом доверительного эллипса является , и полезно просмотреть предыдущие вопросы в этом теге. Наш текущий вопрос с наибольшим количеством голосов в этом теге особенно хорош: почему 95% -й доверительный интервал не подразумевает 95-процентную вероятность сдерживания среднего значения? Большая часть дискуссии там также справедлива для многомерных аналогов одномерного доверительного интервала.

Стефан Коласса
источник
1

Это зависит от области, к которой относится это понятие. То, что было сказано выше, верно для статистики, но когда мы применяем статистику к другим предметам, все немного по-другому. Например, в биомеханике мы используем термин «эллипс доверия» (хотя ведутся споры о том, должен ли он быть эллипсом предсказания) в качестве метода измерения центра смещения давления, когда субъект стоит на силовой платформе. Тогда предполагается, что эллипс, нарисованный вокруг двух осей (большой и малой), содержит 95% точек данных, которые представляют центр смещения давления за время испытания.

Катрин Кацигианни
источник