Как границы погрешности связаны с доверительными интервалами?

11

Может кто-нибудь сказать мне разницу между краями ошибки и доверительными интервалами? В Интернете я вижу, как эти два значения взаимозаменяемы.

Правильно ли сказать,

«Доверительные интервалы показаны как 1,96 и отображаются на графиках в виде полей ошибок»?

Mintuz
источник
1
Полезные обсуждения по этой теме можно найти, выполнив поиск на нашем сайте .
whuber

Ответы:

13

Интернет полон мусора, как все мы знаем. Это помогает найти авторитетные источники и сосредоточиться на них, чтобы помочь решить такие проблемы. Брошюра публикуется Американской статистической ассоциации (приписывается Fritz Scheuren и «полностью обновлен около 1997») определяет предел погрешности как 95% доверительный интервал (стр. 64, справа).

В свете этого удивительно, что в статье Википедии о допустимой погрешности используется другое определение, хотя в ней содержится ссылка на эту брошюру! Википедия пишет:

Допустимая погрешность обычно определяется как «радиус» (или половина ширины) доверительного интервала для конкретной статистики из опроса. ... Когда для опроса сообщается единый глобальный предел погрешности, он относится к максимальному допустимому пределу погрешности для всех сообщенных процентов с использованием полной выборки из опроса.

Другими слова, в Википедию МОС являются половиной максимальной шириной набора доверительных интервалов (которые могут иметь покрытие , отличающиеся от 95%).

Мы обсуждали эту путаницу (или, по крайней мере, отсутствие стандартизации) в комментариях в других местах на этом сайте. Мы пришли к выводу, что вам нужно четко понимать, что вы подразумеваете под «пределом погрешности», когда используете этот термин.

Whuber
источник
7

Не существует общепринятого соглашения о том, что такое «предел погрешности», но я думаю (как вы заметили), оно чаще всего используется как значение радиуса доверительного интервала , либо в исходной шкале оценки, либо в процентах. оценки. Иногда он используется как синоним «стандартной ошибки», поэтому вам нужно быть осторожным, чтобы другие поняли, что вы имеете в виду, когда используете его.

А «доверительный интервал» действительно имеет универсальное соглашение о его значении. В основном это диапазон возможных оценок, генерируемых процессом оценки, который в X% случаев (наиболее часто используемый 95%) содержит истинное значение оцениваемого параметра. Эта концепция «процесса», которая будет производить истинное значение X% времени, является немного нелогичной и не должна смешиваться с «интервалом достоверности» из байесовского вывода, который имеет гораздо более интуитивное определение, но не то же самое, что широко используемый доверительный интервал.

Ваша фактическая цитата немного грязная и требует небольшого исправления, как описано. Я бы избегал этого дополнительного использования слова «маржа» и отдавал предпочтение «барам ошибок». Так:

«Доверительные интервалы оцениваются как 1,96, умноженные на соответствующие стандартные ошибки и показанные на графиках в виде столбцов ошибок».

(Это оставляет в стороне вопрос, является ли это хорошим способом для вычисления доверительных интервалов, который зависит от вашей модели и т. Д. И не имеет значения).

Заключительный комментарий по терминологии - мне не нравится «стандартная ошибка», которая просто означает «стандартное отклонение оценки»; или «ошибка выборки» в целом - я предпочитаю думать с точки зрения случайности и дисперсии статистики, а не «ошибок». Но я использовал термин «стандартная ошибка» выше, потому что он так широко используется, я думаю.

Питер Эллис
источник