Узкий доверительный интервал - более высокая точность?

18

У меня есть два вопроса о доверительных интервалах:

По-видимому, узкий доверительный интервал подразумевает, что вероятность получения наблюдения в этом интервале меньше, поэтому наша точность выше.

Также 95% доверительный интервал уже, чем 99% доверительный интервал, который шире.

99% доверительный интервал является более точным, чем 95%.

Может ли кто-нибудь дать простое объяснение, которое могло бы помочь мне понять эту разницу между точностью и узостью?

вышеперечисленное
источник
2
Я думаю, что вы имеете в виду «есть шанс получить наблюдение за пределами этого интервала». К сожалению, доверительный интервал может не означать того, что он означает, из-за технических, статистических проблем, но в целом, чем уже интервал (при заданном уровне достоверности), тем меньше неопределенности в отношении результатов. На этом сайте много тем, обсуждающих, что означает доверительный интервал (в отличие, скажем, от доверительного интервала). Мы даже не входим в прогнозируемые интервалы ...
Уэйн
@Wayne Почему утверждение не "есть меньший шанс получить наблюдение в этом интервале"? Поскольку узкий интервал имеет большую ошибку типа 1, он с большей вероятностью отвергает гипотезу истинного нуля, то есть мое истинное нулевое значение не содержится в этом интервале. Так что, мне кажется, a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalэто правильно. Не могли бы вы объяснить, где я делаю ошибку?
пользователь 31466

Ответы:

19

95% вообще не связаны с тем, насколько вы уверены, что вы раскрыли истинный эффект в своем эксперименте. Возможно, признавая, что «интервал, использующий 95% расчет диапазона покрытия», может быть более точным названием для него. Вы можете сделать выбор, чтобы решить, что интервал содержит истинное значение; и вы будете правы, если будете делать это последовательно в 95% случаев. Но вы действительно не знаете, насколько вероятно это для вашего конкретного эксперимента без дополнительной информации.

Q1: Ваш первый запрос объединяет две вещи и неправильно использует термин. Не удивительно, что ты в замешательстве. Более узкий доверительный интервал может быть более точным, но при одинаковом расчете, таком как метод 95%, все они имеют одинаковую точность. Они фиксируют истинную ценность в той же пропорции времени.

Кроме того, только то, что он узкий, не означает, что вы с меньшей вероятностью столкнетесь с выборкой, попадающей в этот узкий доверительный интервал. Узкий доверительный интервал может быть достигнут одним из трех способов. Экспериментальный метод или характер данных могут иметь очень низкую дисперсию. Доверительный интервал около точки кипения водопроводной воды на уровне моря довольно мал, независимо от размера выборки. Доверительный интервал вокруг среднего веса людей может быть довольно большим, потому что люди очень изменчивы, но можно сделать этот доверительный интервал меньшим, просто получив больше наблюдений. В этом случае, когда вы получите больше уверенности в том, где, по вашему мнению, истинное значение, собрав больше образцов и сделав более узкий доверительный интервал, тогда вероятность встречи с человеком в этом доверительном интервале снижается. (он уменьшается в любом случае, когда вы увеличиваете размер образца, но вы можете не беспокоиться о сборе большого образца в случае с кипящей водой). Наконец, он может быть узким, потому что ваш образец не представлен. В этом случае у вас, скорее всего, будет один из 5% интервалов, который не содержит истинного значения. Это немного парадоксально в отношении ширины CI и что-то, что вы должны проверить, зная литературу и насколько обычно эти данные являются переменными. В этом случае у вас, скорее всего, будет один из 5% интервалов, который не содержит истинного значения. Это немного парадоксально в отношении ширины CI и что-то, что вы должны проверить, зная литературу и насколько обычно эти данные являются переменными. В этом случае у вас, скорее всего, будет один из 5% интервалов, который не содержит истинного значения. Это немного парадоксально в отношении ширины CI и что-то, что вы должны проверить, зная литературу и насколько обычно эти данные являются переменными.

Далее учтите, что доверительный интервал - это попытка оценить истинное среднее значение населения. Если бы вы знали это место, то вы были бы еще более точным (и точным) и даже не имели бы диапазона оценок. Но ваша вероятность встретить наблюдение с точно таким же значением будет намного ниже, чем найти его в какой-либо конкретной выборочной КИ.

Q2 : 99% доверительный интервал шире, чем 95%. Поэтому более вероятно, что он будет содержать истинное значение. Посмотрите на различие выше между точным и точным, вы смешиваете их. Если я сделаю доверительный интервал более узким с меньшей изменчивостью и большим размером выборки, он станет более точным, вероятные значения охватывают меньший диапазон. Если я увеличу покрытие с помощью расчета 99%, оно станет более точным, истинное значение, скорее всего, будет в пределах диапазона.

Джон
источник
2
Изменчивость среднего значения (= то, что вы пытаетесь оценить) в популяции равна нулю.
Ник Сэбб
10

Для данного набора данных увеличение уровня достоверности доверительного интервала приведет только к увеличению интервалов (или, по крайней мере, не к уменьшению ). Дело не в точности или аккуратности, а в том, насколько вы готовы пойти на риск, упуская истинную ценность.

Если вы сравниваете доверительные интервалы для одного и того же вида параметров из нескольких наборов данных, и один из них меньше другого, вы можете сказать, что меньший является более точным . Я предпочитаю говорить о точности, а не о точности в этой ситуации (см. Соответствующую статью в Википедии ).

Карл
источник
Что подразумевается под «однотипными параметрами» и «множественными наборами данных»? Скажем, опрос по неграмотности и опрос проводится в разное время, 1995, 1998 и т. Д. Тогда является ли «коэффициент неграмотности» одним и тем же параметром и указывают ли наборы данных 1995, 1998 и т. Д. На несколько наборов данных?
пользователь 31466
Например, набор доверительных интервалов, каждый для среднего значения некоторой совокупности. Твой пример тоже подходит, я думаю.
Карл
3

Прежде всего, CI для данного процента достоверности (например, 95%) означает, что для всех практических целей (хотя технически это не правильно), что вы уверены, что истинное значение находится в интервале.

Если этот интервал является «узким» (обратите внимание, что это можно рассматривать только относительным образом, поэтому для сравнения с последующим скажем, что он имеет ширину 1 единицу), это означает, что места для игры не так много: какое бы значение не было вы выбираете в этом интервале будет близко к истинному значению (потому что интервал узкий), и вы совершенно уверены в этом (95%).

Сравните это с относительно широким 95% -ным доверительным интервалом (чтобы соответствовать приведенному выше примеру, скажем, его ширина составляет 100 единиц): здесь вы все еще на 95% уверены, что истинное значение будет в этом интервале, но это не очень много, поскольку в интервале относительно много значений (примерно в 100 раз, а не в 1 - и я снова прошу пуристов игнорировать упрощение).

Как правило, вам понадобится больший интервал, когда вы хотите быть на 99% уверенным, что в нем есть истинное значение, чем когда вам нужно быть уверенным только на 95% (примечание: это может быть не так, если интервалы не являются вложенными ), поэтому, действительно, чем больше доверия вам нужно, тем шире интервал вам нужно будет выбрать.

С другой стороны, вы находитесь более определенным с более высоким доверительным интервалом. Итак, если я дам вам 2 интервала одинаковой ширины, и я скажу, что один является 95% -ным доверительным интервалом, а другой - 99% -ым доверительным интервалом, я надеюсь, что вы предпочтете 99% один. В этом смысле 99% КИ более точны: у вас меньше сомнений в том, что вы упустили истину.

Ник Сабби
источник
Благодарность! Итак, когда они говорят, что это новое исследование нейтрино, которое быстрее света, имеет очень маленький доверительный интервал (я думаю, это означает узкий интервал), то это означает, что они с большей вероятностью будут точны, чем если бы это был широкий доверительный интервал? (игнорируя все остальные аспекты)
выше
10
Ник, ваше первое утверждение неверно. Это не "техническая проблема", это просто не правильно. Доверительный интервал - это утверждение о том, что произойдет в повторных экспериментах, что они будут охватывать истинное значение в 95% случаев. Утверждение об уверенности в том, что истинное значение находится в пределах моего заданного диапазона, найденного в моем данном эксперименте, совсем не то же самое, что вообще. Если вы удалите «то» в «этом уверенном» и в скобках числовое значение, то вы будете ближе к истине. Вы могли бы просто сказать, что это означает, что вы верите, что истинное значение может упасть в интервале.
Джон
в противном случае ответ довольно хороший ...
Джон
4
@John: Я специально избегал говорить, что сам интервал является случайной величиной, хотя мое предложение не подразумевает, что это не так (по общему признанию, это действительно так). Я знаю связанные с этим проблемы, но нашел их неуместными для вопроса. Я никогда не видел практической ситуации, где разница имела бы значение, следовательно, «для всех практических целей».
Ник Сэбб
4
Не сталкивались с проблемой? Это все равно, что сказать значение p = вероятность нулевого значения, а затем сказать, что вы никогда не сталкивались с проблемой с ним. Вы не будете, если вы останетесь в правильных журналах. Просто неправильно говорить, что вы на 95% уверены, что истинное значение находится в вашем текущем диапазоне. Относиться к этому как к некоторому эзотерическому вопросу просто означает, что теперь у нас будет (по крайней мере) еще один человек, который говорит: «Я на 95% уверен, что значение в этом диапазоне» Это вряд ли изменит ваш ответ, чтобы исправить это. Другие проблемы, которые вы обойдете, могут быть проигнорированы, если вы измените это утверждение.
Джон,
3

Я добавляю здесь несколько хороших ответов, за которые я проголосовал. Я думаю, что нужно еще кое-что сказать, чтобы полностью прояснить вывод. Мне нравятся термины, точные и правильные, как их определяет Эфрон. Недавно я провел длительное обсуждение этого вопроса по другому вопросу. Умеренный whuber действительно понравился этот ответ. Я не пойду на то же самое, чтобы повторить это здесь. Однако к Эфрону точность относится к уровню достоверности и правильности ширины или плотности интервала. Но вы не можете говорить о тесноте, не задумываясь о точности. Некоторые доверительные интервалы являются точными, потому что они имеют фактическое покрытие, которое они рекламируют. 95-процентный доверительный интервал также может быть приблизительным, поскольку он использует асимптотическое распределение. Приблизительные интервалы, основанные на асимптотике, предназначены для конечного размера выборки, и у него не будет объявленного покрытия, которое будет покрытием, которое вы получите, если асимптотическое распределение будет точным. Таким образом, приблизительный интервал может быть скрытым (то есть рекламировать 95%, когда его фактическое покрытие составляет всего 91%) или в редких, но менее серьезных случаях (например, рекламируемое покрытие составляет 95%, но фактическое в 98%). В первом случае мы беспокоимся о том, насколько близко фактическое покрытие к рекламируемому покрытию). Мера близости - это порядок точности, который можно сказать 1 / √n или 1 / n. Если фактический уровень доверия близок, мы называем его точным. Точность важна с доверительными интервалами начальной загрузки, которые никогда не бывают точными, но некоторые варианты более точны, чем другие.

Это определение точности может отличаться от того, к которому относится ОП, но теперь должно быть ясно, что такое определение Эфрона и почему важно быть точным. Теперь, если у вас есть два точных метода, мы можем предпочесть один из других, если для любого уровня достоверности он имеет меньшую ожидаемую ширину. Лучшим в этом смысле будет интервал доверия (иногда называемый кратчайшим). Но это требовало точности. Если уровень доверия только приблизительный, мы могли бы сравнивать яблоки и апельсины. Один может быть уже другого только потому, что он менее точен и, следовательно, имеет более низкий фактический охват, чем его рекламируемый охват.

Если два доверительных интервала оба являются очень точными или один является точным, а другой очень точный, сравнивая ожидаемую ширину, может быть хорошо, потому что, по крайней мере, сейчас мы рассматриваем только два двух сорта яблок.

Майкл Р. Черник
источник