Для невзвешенной дисперсии существует дисперсия выборки с поправкой на смещение, когда среднее значение было оценено по тем же данным: Var(X):=1
Я смотрю на средневзвешенную и дисперсию и задаюсь вопросом, какова подходящая поправка смещения для взвешенной дисперсии. Использование:
Я использую "наивную" не исправленную дисперсию:
Так что мне интересно, правильный ли способ исправления смещения
A)
или B)
или C)
А) не имеет смысла для меня, когда веса небольшие. Значение нормализации может быть 0 или даже отрицательным. Но как насчет B) ( - количество наблюдений) - это правильный подход? У вас есть ссылка, которая показывает это? Я верю "Обновление среднего и дисперсионных оценок: улучшенный метод", DHD West, 1979 использует это. В-третьих, C) - моя интерпретация ответа на этот вопрос: /mathpro/22203/unbiased-estimate-of-the-variance-of-an-unnormalised-weighted-mean
Для C) Я только что понял, что знаменатель очень похож на . Есть ли здесь какая-то общая связь? Я думаю, что это не совсем совпадает; и, очевидно, есть связь, которую мы пытаемся вычислить дисперсию ...
Все три из них, похоже, "выживают" при проверке установки всех . Так, какой я должен использовать, под каким помещением? '' Update: '' whuber предложил также выполнить проверку работоспособности с помощью и всех оставшихся крошечных. Это, кажется, исключает А и Б.ω 1 = ω 2 = .5 ω i = ϵ
источник
Ответы:
Я прошел математику и закончил с вариантом C:
Установив , мы получимλя= ωяΣяωя
Расширение внутреннего члена дает:
Если мы возьмем ожидание, мы получим, что , член присутствует в каждом члене, он отменяется, и мы получить:Е[ хяИксJ] = Vа г ( х) 1я = j+ E[ X]2 Е[ X]
источник
И A, и C верны, но какой из них вы будете использовать, зависит от того, какие веса вы используете:
Причина, по которой С является необъективной, заключается в том, что если вы не используете веса типа «повтор», вы теряете возможность подсчитывать общее количество наблюдений (размер выборки) и, следовательно, не можете использовать поправочный коэффициент.
Для получения дополнительной информации, проверьте статью Wikipedia, которая была недавно обновлена: http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
источник