У меня есть два вопроса о доверительных интервалах:
По-видимому, узкий доверительный интервал подразумевает, что вероятность получения наблюдения в этом интервале меньше, поэтому наша точность выше.
Также 95% доверительный интервал уже, чем 99% доверительный интервал, который шире.
99% доверительный интервал является более точным, чем 95%.
Может ли кто-нибудь дать простое объяснение, которое могло бы помочь мне понять эту разницу между точностью и узостью?
confidence-interval
вышеперечисленное
источник
источник
a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that interval
это правильно. Не могли бы вы объяснить, где я делаю ошибку?Ответы:
95% вообще не связаны с тем, насколько вы уверены, что вы раскрыли истинный эффект в своем эксперименте. Возможно, признавая, что «интервал, использующий 95% расчет диапазона покрытия», может быть более точным названием для него. Вы можете сделать выбор, чтобы решить, что интервал содержит истинное значение; и вы будете правы, если будете делать это последовательно в 95% случаев. Но вы действительно не знаете, насколько вероятно это для вашего конкретного эксперимента без дополнительной информации.
Q1: Ваш первый запрос объединяет две вещи и неправильно использует термин. Не удивительно, что ты в замешательстве. Более узкий доверительный интервал может быть более точным, но при одинаковом расчете, таком как метод 95%, все они имеют одинаковую точность. Они фиксируют истинную ценность в той же пропорции времени.
Кроме того, только то, что он узкий, не означает, что вы с меньшей вероятностью столкнетесь с выборкой, попадающей в этот узкий доверительный интервал. Узкий доверительный интервал может быть достигнут одним из трех способов. Экспериментальный метод или характер данных могут иметь очень низкую дисперсию. Доверительный интервал около точки кипения водопроводной воды на уровне моря довольно мал, независимо от размера выборки. Доверительный интервал вокруг среднего веса людей может быть довольно большим, потому что люди очень изменчивы, но можно сделать этот доверительный интервал меньшим, просто получив больше наблюдений. В этом случае, когда вы получите больше уверенности в том, где, по вашему мнению, истинное значение, собрав больше образцов и сделав более узкий доверительный интервал, тогда вероятность встречи с человеком в этом доверительном интервале снижается. (он уменьшается в любом случае, когда вы увеличиваете размер образца, но вы можете не беспокоиться о сборе большого образца в случае с кипящей водой). Наконец, он может быть узким, потому что ваш образец не представлен. В этом случае у вас, скорее всего, будет один из 5% интервалов, который не содержит истинного значения. Это немного парадоксально в отношении ширины CI и что-то, что вы должны проверить, зная литературу и насколько обычно эти данные являются переменными. В этом случае у вас, скорее всего, будет один из 5% интервалов, который не содержит истинного значения. Это немного парадоксально в отношении ширины CI и что-то, что вы должны проверить, зная литературу и насколько обычно эти данные являются переменными. В этом случае у вас, скорее всего, будет один из 5% интервалов, который не содержит истинного значения. Это немного парадоксально в отношении ширины CI и что-то, что вы должны проверить, зная литературу и насколько обычно эти данные являются переменными.
Далее учтите, что доверительный интервал - это попытка оценить истинное среднее значение населения. Если бы вы знали это место, то вы были бы еще более точным (и точным) и даже не имели бы диапазона оценок. Но ваша вероятность встретить наблюдение с точно таким же значением будет намного ниже, чем найти его в какой-либо конкретной выборочной КИ.
Q2 : 99% доверительный интервал шире, чем 95%. Поэтому более вероятно, что он будет содержать истинное значение. Посмотрите на различие выше между точным и точным, вы смешиваете их. Если я сделаю доверительный интервал более узким с меньшей изменчивостью и большим размером выборки, он станет более точным, вероятные значения охватывают меньший диапазон. Если я увеличу покрытие с помощью расчета 99%, оно станет более точным, истинное значение, скорее всего, будет в пределах диапазона.
источник
Для данного набора данных увеличение уровня достоверности доверительного интервала приведет только к увеличению интервалов (или, по крайней мере, не к уменьшению ). Дело не в точности или аккуратности, а в том, насколько вы готовы пойти на риск, упуская истинную ценность.
Если вы сравниваете доверительные интервалы для одного и того же вида параметров из нескольких наборов данных, и один из них меньше другого, вы можете сказать, что меньший является более точным . Я предпочитаю говорить о точности, а не о точности в этой ситуации (см. Соответствующую статью в Википедии ).
источник
Прежде всего, CI для данного процента достоверности (например, 95%) означает, что для всех практических целей (хотя технически это не правильно), что вы уверены, что истинное значение находится в интервале.
Если этот интервал является «узким» (обратите внимание, что это можно рассматривать только относительным образом, поэтому для сравнения с последующим скажем, что он имеет ширину 1 единицу), это означает, что места для игры не так много: какое бы значение не было вы выбираете в этом интервале будет близко к истинному значению (потому что интервал узкий), и вы совершенно уверены в этом (95%).
Сравните это с относительно широким 95% -ным доверительным интервалом (чтобы соответствовать приведенному выше примеру, скажем, его ширина составляет 100 единиц): здесь вы все еще на 95% уверены, что истинное значение будет в этом интервале, но это не очень много, поскольку в интервале относительно много значений (примерно в 100 раз, а не в 1 - и я снова прошу пуристов игнорировать упрощение).
Как правило, вам понадобится больший интервал, когда вы хотите быть на 99% уверенным, что в нем есть истинное значение, чем когда вам нужно быть уверенным только на 95% (примечание: это может быть не так, если интервалы не являются вложенными ), поэтому, действительно, чем больше доверия вам нужно, тем шире интервал вам нужно будет выбрать.
С другой стороны, вы находитесь более определенным с более высоким доверительным интервалом. Итак, если я дам вам 2 интервала одинаковой ширины, и я скажу, что один является 95% -ным доверительным интервалом, а другой - 99% -ым доверительным интервалом, я надеюсь, что вы предпочтете 99% один. В этом смысле 99% КИ более точны: у вас меньше сомнений в том, что вы упустили истину.
источник
Я добавляю здесь несколько хороших ответов, за которые я проголосовал. Я думаю, что нужно еще кое-что сказать, чтобы полностью прояснить вывод. Мне нравятся термины, точные и правильные, как их определяет Эфрон. Недавно я провел длительное обсуждение этого вопроса по другому вопросу. Умеренный whuber действительно понравился этот ответ. Я не пойду на то же самое, чтобы повторить это здесь. Однако к Эфрону точность относится к уровню достоверности и правильности ширины или плотности интервала. Но вы не можете говорить о тесноте, не задумываясь о точности. Некоторые доверительные интервалы являются точными, потому что они имеют фактическое покрытие, которое они рекламируют. 95-процентный доверительный интервал также может быть приблизительным, поскольку он использует асимптотическое распределение. Приблизительные интервалы, основанные на асимптотике, предназначены для конечного размера выборки, и у него не будет объявленного покрытия, которое будет покрытием, которое вы получите, если асимптотическое распределение будет точным. Таким образом, приблизительный интервал может быть скрытым (то есть рекламировать 95%, когда его фактическое покрытие составляет всего 91%) или в редких, но менее серьезных случаях (например, рекламируемое покрытие составляет 95%, но фактическое в 98%). В первом случае мы беспокоимся о том, насколько близко фактическое покрытие к рекламируемому покрытию). Мера близости - это порядок точности, который можно сказать 1 / √n или 1 / n. Если фактический уровень доверия близок, мы называем его точным. Точность важна с доверительными интервалами начальной загрузки, которые никогда не бывают точными, но некоторые варианты более точны, чем другие.
Это определение точности может отличаться от того, к которому относится ОП, но теперь должно быть ясно, что такое определение Эфрона и почему важно быть точным. Теперь, если у вас есть два точных метода, мы можем предпочесть один из других, если для любого уровня достоверности он имеет меньшую ожидаемую ширину. Лучшим в этом смысле будет интервал доверия (иногда называемый кратчайшим). Но это требовало точности. Если уровень доверия только приблизительный, мы могли бы сравнивать яблоки и апельсины. Один может быть уже другого только потому, что он менее точен и, следовательно, имеет более низкий фактический охват, чем его рекламируемый охват.
Если два доверительных интервала оба являются очень точными или один является точным, а другой очень точный, сравнивая ожидаемую ширину, может быть хорошо, потому что, по крайней мере, сейчас мы рассматриваем только два двух сорта яблок.
источник