Для каких распределений существует объективная оценка в закрытой форме для стандартного отклонения?

16

Для нормального распределения существует объективная оценка стандартного отклонения, определяемая как:

σ^unbiased=Γ(n12)Γ(n2)12k=1n(xix¯)2

Причина, по которой этот результат не так хорошо известен, по-видимому, состоит в том, что это в значительной степени курьез, а не вопрос какого-либо большого значения . Доказательство покрыто на этой теме ; он использует ключевое свойство нормального распределения:

1σ2k=1n(xix¯)2χn12

Оттуда, немного поработав, можно принять ожидание , апутем выявления этого ответа как кратноесг, мы можем вывести результат для σ несмещенного.E(k=1n(xix¯)2)σσ^unbiased

Это оставляет меня любопытным, какие другие распределения имеют непредвзятую оценку стандартного отклонения в закрытой форме. В отличие от объективной оценки дисперсии, это явно зависит от распределения. Более того, было бы непросто адаптировать доказательство, чтобы найти оценки для других распределений.

Распределения с нормальным перекосом обладают некоторыми хорошими свойствами распределения для своих квадратичных форм, которые мы обычно используем в качестве свойства нормального распределения (так как нормаль - это особый тип косо-нормального распределения), так что, возможно, это будет не так сложно распространить этот метод на них. Но для других распределений может показаться, что требуется совершенно другой подход.

Существуют ли другие распределения, для которых известны такие оценки?

тарпон
источник
1
Если игнорировать технические отвлекающие факторы, характер ответа становится более понятным. В нормальном случае мало того, что вы пишете, действительно имеет отношение к заключению; все, что имеет значение, состоит в том, что величина смещения в этом конкретном оценщике является функцией только (и не зависит от других параметров распределения, которые должны быть оценены из данных). n
whuber
@whuber Я думаю, что вижу общую идею, на которую вы намекаете, и ясно, что «функция одного только » необходима. Но я не думаю, что этого было бы достаточно - если бы у нас не было доступа к каким-то хорошим результатам распространения, тогда я не могу понять, как аспект «закрытой формы» можно было бы отслеживать. n
Серебряная рыба
5
Это зависит от того, что вы подразумеваете под «закрытой формой». Например, для одного человека тэта-функция может быть «закрытой», но для другого это просто бесконечный продукт, степенной ряд или сложный интеграл. Если подумать, это именно то, что такое гамма-функция :-).
whuber
@whuber Хорошая мысль! Под «величиной смещения в данном конкретном оценщике» я понимаю, что вы имеете в виду, что смещение в (а не в оценке, приведенной в вопросе, которая имеет нулевое смещение) является функцией n (а также в σ , но, к счастью, таким образом, что мы можем легко изменить, чтобы найти объективную оценку)? snσ
Серебряная рыба
1
@whuber: должна быть похожая формула для любого семейства масштабов с указанием того, что функция может быть неразрешимым интегралом. n
Сиань

Ответы:

10

Хотя это напрямую не связано с вопросом, существует статья Питера Биккеля и Эриха Лемана 1968 года, в которой говорится, что для выпуклого семейства распределений существует несмещенная оценка функционала q ( F ) (для размера выборки). n достаточно большой) тогда и только тогда, когда q ( α F + ( 1 - α ) G ) является полиномом от 0 α 1Fq(F)nq(αF+(1α)G)0α1, Эта теорема здесь не применима к задаче, поскольку набор гауссовых распределений не является выпуклым (смесь гауссианов не является гауссовой).

Расширение результата в вопросе заключается в том, что любая степень стандартного отклонения может быть объективно оценена при условии, что имеется достаточно наблюдений, когда α < 0 . Это следует из результата 1σαα<0 чтоσявляется масштабным (и уникальным) параметром для n k = 1 (xi- ˉ x )2.

1σ2k=1n(xix¯)2χn12
σk=1n(xix¯)2

Эту нормальную настройку затем можно распространить на любое семейство масштабов местоположения с конечной дисперсией σ 2 . В самом деле,

X1,,Xniidτ1f(τ1{xμ})
σ2
  1. the variance
    varμ,τ(X)=Eμ,τ[(Xμ)2]=τ2E0,1[X2]
    is only a function of τ;
  2. the sum of squares
    Eμ,τ[k=1n(XiX¯)2]=τ2Eμ,τ[k=1nτ2(XiμX¯+μ)2]=τ2E0,1[k=1n(XiX¯)2]
    has an expectation of the form τ2ψ(n);
  3. and similarly for any power
    Eμ,τ[{k=1n(XiX¯)2}α]=τ2αE0,1[{k=1n(XiX¯)2}α]
    such that the expectation is finite.
Xi'an
источник
10

A probably well known case, but a case nevertheless.
Consider a continuous uniform distribution U(0,θ). Given an i.i.d. sample, the maximum order statistic, X(n) has expected value

E(X(n))=nn+1θ

The standard deviation of the distribution is

σ=θ23

So the estimator

σ^=123n+1nX(n)

is evidently unbiased for σ.

This generalizes to the case where the lower bound of the distribution is also unknown, since we can have an unbiased estimator for the Range, and then the standard deviation is again a linear function of the Range (as is essentially above also).

This exemplifies @whuber's comment, that "the amount of bias is a function of n alone" (plus possibly any known constants) -so it can be deterministically corrected. And this is the case here.

Alecos Papadopoulos
источник
4
Now the hard part: when in the world are we interested in the standard deviation of a uniform distribution? (+1)
shadowtalker
1
@ssdecontrol That's an excellent question! -please proceed to the next one...
Alecos Papadopoulos
2
One thing I love about this answer is how poor the estimator is. It's quite common to see a question which boils down to "why do we use θ^ as an estimator even though it's biased?" Some students need convincing that unbiasedness is not the be-all and end-all, and a poor unbiased estimator is one way to show them.
Silverfish
1
@Silverfish Poor in what way? Some quick simulations show this to have lower MSE than the usual standard deviation (which surprised me).
Dave
@Dave Interesting! I had jumped to the conclusion it would be poor since it only looked at the maximum order statistic, but I too stand surprised! Shows the value of doing some simulation...
Silverfish