Почему в этом отрывке говорится, что объективная оценка стандартного отклонения обычно не актуальна?

14

Я читал о вычислении объективной оценки стандартного отклонения и источника, который я прочитал

(...) за исключением некоторых важных ситуаций, задача имеет мало отношения к приложениям статистики, поскольку ее необходимость избегается стандартными процедурами, такими как использование тестов значимости и доверительных интервалов, или с помощью байесовского анализа.

Мне было интересно, может ли кто-нибудь объяснить причину этого утверждения, например, не использует ли доверительный интервал стандартное отклонение как часть расчета? Следовательно, не повлияют ли доверительные интервалы на предвзятое стандартное отклонение?

РЕДАКТИРОВАТЬ:

Пока что спасибо за ответы, но я не совсем уверен, что следую некоторым из них, поэтому добавлю очень простой пример. Дело в том, что если источник верен, то в моем заключении к примеру что-то не так, и я хотел бы, чтобы кто-то указал, как значение p не зависит от стандартного отклонения.

Предположим, что исследователь хотел проверить, отличается ли средний балл пятиклассников на тесте в его или ее городе от среднего по стране показателя 76 с уровнем значимости 0,05. Исследователь случайно отобрал оценки у 20 студентов. Среднее значение по выборке составило 80,85 со стандартным отклонением по выборке 8,87. Это означает: t = (80,85-76) / (8,87 / sqrt (20)) = 2,44. Затем используется t-таблица, чтобы вычислить, что двустороннее значение вероятности в 2,44 с 19 df равно 0,025. Это ниже нашего уровня значимости 0,05, поэтому мы отвергаем нулевую гипотезу.

Таким образом, в этом примере не изменится ли значение p (и, возможно, ваше заключение) в зависимости от того, как вы оценили стандартное отклонение выборки?

BYS2
источник
2
Это кажется странным по той причине, которую вы даете. Возможно, вы могли бы дать нам этот абзац и раньше, если нам чего-то не хватает? Одна вещь, которая делает смещение незначительным, заключается в том, что оно становится довольно неважным по мере того, как размер выборки становится больше, и, вероятно, не является существенным по сравнению со всеми другими проблемами, например, неправильной спецификацией модели, которая у нас обычно есть, - но это не причина дано в вашем источнике.
Питер Эллис
1
@PeterEllis, это на самом деле со страницы в Википедии, посвященной «объективной оценке стандартного отклонения» ( en.wikipedia.org/wiki/Unbiased_estima_of_standard_deviation ).
BYS2

Ответы:

17

Я согласен с Glen_b по этому вопросу. Может быть, я могу добавить несколько слов, чтобы прояснить ситуацию. Если данные поступают из нормального распределения (ситуация iid) с неизвестной дисперсией, t-статистика - это основная величина, используемая для генерации доверительных интервалов и проверки гипотез. Единственное, что имеет значение для этого вывода, - это его распределение по нулевой гипотезе (для определения критического значения) и по альтернативе (для определения мощности и выборки). Это центральное и нецентральное t-распределения соответственно. Теперь, на мгновение рассматривая одну примерную задачу, t-критерий даже имеет оптимальные свойства в качестве критерия для среднего нормального распределения. Теперь выборочная дисперсия является объективной оценкой дисперсии населения, но ее квадратный корень является оценкой BIASED стандартного отклонения населения. Это не Не имеет значения, что эта оценочная величина БИАЗА входит в знаменатель ключевой величины. Теперь он играет роль в том, что он является последовательной оценкой. Это то, что позволяет распределению t приближаться к стандартной норме, поскольку размер выборки стремится к бесконечности. Но быть предвзятым для любого фиксированного не влияет на хорошие свойства теста.n

На мой взгляд, беспристрастность переоценивается в начальных классах статистики. Точность и согласованность оценок - это реальные свойства, которые заслуживают особого внимания.

Для других задач, где применяются параметрические или непараметрические методы, оценка стандартного отклонения даже не входит в формулу.

Майкл Р. Черник
источник
7
Это зависит от оценки, но есть только одна оценка, к которой относится t с 19 степенями свободы, и эта оценка является квадратным корнем из обычной оценки выборочной дисперсии. Если вы используете другую оценку стандартного отклонения, у вас будет другое эталонное распределение для статистики теста при нулевой гипотезе. Это не т.
Майкл Р. Черник
2
@ BYS2: обратите внимание, что с точки зрения интервала, построенного в приведенном вами примере, ничего не меняется, умножая стандартное отклонение выборки на коэффициент масштабирования (например, чтобы сделать его беспристрастным). Распределение тестовой статистики будет меняться (немного) в этом случае, но CI построил бы в конечном итоге точно так же! Теперь, если бы вы сделали некоторую «коррекцию», которая зависела от самих данных, это дало бы что-то другое (в общем). Смотрите мой комментарий под ответом Глена.
кардинал
4
@ BYS2: в нормальном модельном случае, использующем -статистику, существует хорошее соответствие между CI и p- значением. Таким образом, p- значение не изменится, если вы «масштабируете» стандартное отклонение выборки на известную константу. Например: Пусть ~ T Ь = ( ˉ Х - μ ) / ( б сг ) = Т / б при фиксированном б > 0 . Тогда Р ( ~ Т Ь > у > б ц )tppT~b=(X¯μ)/(bσ^)=T/bb>0
P(T~b>u)=P(T>bu)
и так критического значения , то есть, существует взаимно однозначное соответствие одному между ними. Имеет ли это смысл? t~b,α=btα
кардинал
1
Нет, на что правильно указывает кардинал, это то, что можно умножить t-статистику на константу, чтобы по существу использовать другую оценку стандартного отклонения. Статистика теста больше не имеет распределения t. Это немного другое распределение из-за константы. Среднее значение изменяется с коэффициентом b, равно как и стандартное отклонение. Когда вы приступаете к вычислению критического значения для статистики теста, оно изменяется соответствующим образом, как он демонстрирует выше.
Майкл Р. Черник
1
@ BYS2 Да, верно.
Майкл Р. Черник
5

Рассмотрим интервал, рассчитанный на основе ключевой величины, такой как t-статистика. Среднее значение оценки для стандартного отклонения на самом деле не входит в это - интервал основан на распределении статистики. Таким образом, утверждение правильно, насколько это идет.

Glen_b - Восстановить Монику
источник
1
Да, но не зависит ли распределение статистики от стандартного отклонения, которое в большинстве случаев неизвестно, поэтому вам нужно использовать оценщик?
BYS2
4
(+1) Глен. To @ BYS2: здесь есть пара ключевых моментов. Во-первых, если у нас есть основное количество под рукой, оно предоставляет очень удобные средства для построения доверительных множеств, но они не часто существуют. Весь смысл ключевой величины в том, что распределение зависит исключительно от известных величин. Во-вторых, основное количество тесно связано с базовой моделью. Если данные отклоняются от предполагаемой модели, то распределение статистики теста может также и ее характеристика как ключевая величина, возможно, не столь уместно. :)
кардинал
4

Интерпретация - это всегда частичное предположение, но я думаю, что подразумеваемый смысл в том, что часто вы можете получить желаемый результат без явной оценки стандартного отклонения. Другими словами, я считаю , что автор имеет в виду ситуации , когда вы не могли бы использовать не оценки стандартного отклонения, а не смещена оценки.

Например, если вы можете построить оценку всего распределения статистики, вы можете вычислить доверительные интервалы без использования стандартного отклонения. Фактически для многих (ненормальных) распределений само стандартное отклонение (и среднее значение) недостаточно для вычисления оценки доверительного интервала. В других случаях, таких как тест знака , вам также не требуется оценка стандартного отклонения.

(Конечно, нетривиально построить несмещенную оценку полного распределения, и в байесовской статистике на самом деле довольно часто вводить смещение явно через предыдущее.)

Номер
источник
1
Возможно, было бы интересно более подробно остановиться на том, что вы имели в виду под последним абзацем. Например, если я могу сделать выборку из имеющегося статистического распределения, то эмпирический cdf предоставляет очень простой и простой способ для генерации поточечной несмещенной оценки функции распределения. :)
кардинал
1
maxiXimaxiXiXi
1
Икся это просто случайная величина, и я предположил, что яможет принимать как минимум 2 разных значения (т. е. как минимум две переменные). В противном случае объективные оценкиМаксимумяИксяне так сложно построить :)
MLS
2
Это верно и близко к тому, что я пытался вытянуть. Первое предложение последнего абзаца относится к построению несмещенной оценки нелинейного статистического функционала, например, из одной случайной выборки. Это сильно отличается от построения несмещенной оценки полного распределения из случайной выборки самой функции. :-)
кардинал