Стандартное отклонение стандартного отклонения

54

Что такое оценка стандартного отклонения стандартного отклонения, если можно предположить нормальность данных?

Ферди
источник
Я полагаю, что вы ищете распределение выборочной дисперсии . Это ссылка на раздел на странице Википедии об отклонениях в 16:55, 21 августа 2016 года. Поскольку это ссылка на Википедию, статья может измениться в будущем. Следовательно, раздел может не отражать содержание, на которое этот ответ ссылается после таких изменений. Поэтому ссылка на историческую версию страницы Википедии приведена здесь. Текущая статья о дисперсии найдена [здесь] ( en.wikipedia.org/wik

Ответы:

58

Пусть . Как показано в этой теме , стандартное отклонение образца стандартное отклонение,X1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

является

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

Γ()nX¯=1ni=1nXisσσsSD(s)

E(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2
макрос
источник
12
+1 Приятно видеть, что спустя почти два года появился не только лучший ответ, но и более полезные детали, чем ссылки в других разделах этой темы.
whuber
2
Вы забыли квадраты расстояний в первой формуле?
Данияр
2
nse(11n)n11
1
Вероятно, стоит отметить, что s (вычисленное в ответе @ Macro иногда упоминается как стандартная ошибка стандартного отклонения выборки.
Harvey
s/2(n1)
5

X1,,Xnσ2σ^2σ2X1,,Xnσ^E[(σσ^)2]σ/n

Робин Жирар
источник
Разве это не функция оценки по-прежнему оценки? Я до сих пор не знаю \ sigma, только X_i.
σ^/n
2σ^22n
1
σ^2n
-3

@Macro предоставил большое математическое объяснение с уравнением для вычисления. Вот более общее объяснение для менее математических людей.

Я думаю, что терминология «SD of SD» многих сбивает с толку. Про доверительный интервал SD легче думать. Насколько точно стандартное отклонение вы вычисляете по образцу? Случайно вы, возможно, случайно получили данные, которые тесно связаны друг с другом, делая SD образца намного ниже, чем SD населения. Или у вас могут быть случайно полученные значения, которые гораздо более разбросаны, чем общая совокупность, что делает SD выборки выше, чем SD совокупности.

Интерпретация CI SD проста. Начните с общепринятого предположения, что ваши данные были случайно и независимо взяты из распределения Гаусса. Теперь повторите эту выборку много раз. Вы ожидаете, что 95% этих доверительных интервалов будут включать истинную популяционную SD.

Насколько 95% доверительный интервал SD? Конечно, это зависит от размера выборки (n).

n: 95% CI от SD

2: 0,45 * SD до 31,9 * SD

3: 0,52 * SD до 6,29 * SD

5: 0,60 * SD до 2,87 * SD

10: 0,69 * SD до 1,83 * SD

25: 0,78 * SD до 1,39 * SD

50: 0,84 * SD до 1,25 * SD

100: 0,88 * SD до 1,16 * SD

500: 0,94 * SD до 1,07 * SD

Бесплатный веб-калькулятор

Харви Мотульский
источник
Я могу сделать Монте-Карло, я просто хотел сделать это более научным способом; Тем не менее, вы правы, что дистрибутив не нормальный, поэтому этот sd будет бесполезен для тестирования.
4
Что бы это ни стоило, меня не устраивает утверждение «доверительный интервал, который составляет 95% ... скорее всего, содержит истинное SD» (или, как указано более явно на связанной странице: «вы можете быть на 95% уверены, что CI, рассчитанный по выборке SD, содержит «истинную популяцию SD»). Я думаю, что эти утверждения флиртуют с укреплением популярного заблуждения, см. Здесь , например, для связанной дискуссии по CV.
gung - Восстановить Монику
5
Что значит «я думаю, что и концепция, и терминология« SD of SD »слишком скользкие, чтобы справляться с ними»? Стандартное отклонение выборки является случайной величиной, которая имеет стандартное отклонение.
Макро
@Macro. Спасибо за ваши комментарии. Я переписал существенно.
Харви Мотульский
1
@ Gung. Я переписал, чтобы правильно объяснить доверительный интервал.
Харви Мотульский