Предположим, что является объективной оценкой для . Тогда, конечно, . ; & thetasE[ & thetas ; |thetas]=thetas
Как можно объяснить это непрофессионалу? В прошлом я говорил, что если вы усредняете набор значений , а размер выборки увеличивается, вы получаете лучшее приближение . ; & thetas
Для меня это проблематично. Я думаю, что я на самом деле описываю здесь этот феномен асимптотически беспристрастного, а не исключительно беспристрастного, то есть где \ hat {\ theta} , вероятно, зависит от n .
Итак, как объяснить беспристрастную оценку непрофессионалу?
bias
asymptotics
unbiased-estimator
estimators
communication
Кларнетист
источник
источник
Ответы:
Технически то, что вы описываете, когда говорите, что ваша оценка приближается к истинному значению при увеличении размера выборки, - это (как уже упоминалось) согласованность или сходимость статистических оценок. Эта сходимость может быть либо сходимостью по вероятности, которая говорит, что для каждого , или почти верная сходимость, которая говорит, что . Обратите внимание, как предел на самом деле внутриε > 0 Р ( Ит п → ∞ | & thetas ; п - & thetas ; | > ε ) = 0limn→∞P(|θ^n−θ|>ϵ)=0 ϵ>0 P(limn→∞|θ^n−θ|>ϵ)=0 вероятность во втором случае. Оказывается, что последняя форма сходимости сильнее, чем другая, но обе они означают, по сути, одно и то же, то есть оценка имеет тенденцию становиться все ближе и ближе к тому, что мы оцениваем, по мере того, как мы собираем больше выборок.
Тонкое моментом здесь является то, что даже когда либо по вероятности или почти наверняка, это не верно вообще , что , поэтому последовательность не подразумевает асимптотическую непредвзятость, как вы предлагаете. Вы должны быть осторожны при переходе от последовательностей случайных величин (которые являются функциями) к последовательностям ожиданий (которые являются интегралами).Limп→∞E( & thetas ; п)=thetasθ^n→θ limn→∞E(θ^n)=θ
Если не принимать во внимание все технические аспекты, это означает, что . Поэтому, когда вы объясняете это кому-то, просто скажите, что если эксперимент повторяется в идентичных условиях много раз, то среднее значение оценки будет близко к истинному значению.E(θ^n)=θ
источник
Я не уверен, если вы путаете последовательность и непредвзятость.
Согласованность: чем больше размер выборки, тем меньше дисперсия оценки.
Объективность: ожидаемое значение оценки равно истинному значению параметров
Итак, ваше предложение
Не является правильным. Даже если размер выборки становится бесконечным, несмещенная оценка останется непредвзятой оценкой, например, если вы оцените среднее значение как «среднее +1», вы можете добавить к своей выборке один миллиард наблюдений, и ваша оценка все равно не даст вам истинного значения.
Здесь вы можете найти более глубокую дискуссию о разнице между последовательностью и непредвзятостью.
В чем разница между последовательной оценкой и объективной оценкой?
источник
@Ferdi уже дал четкий ответ на ваш вопрос, но давайте сделаем его немного более формальным.
Пусть быть ваша выборка независимых и одинаково распределенных случайных величин с распределением . Вы заинтересованы в оценке неизвестного, но фиксированного количества , используя оценку являющуюся функцией . Поскольку является функцией случайных величин, оценитеX1,…,Xn F θ g X 1 , … , X n g g X1,…,Xn g
также случайная величина. Мы определяем смещение как
Оценщик объективен, когда .Eθ(θ^n)=θ
Говоря простым языком: мы имеем дело со случайными переменными , поэтому, если они не вырожденные , если мы взяли разные выборки, мы могли бы ожидать наблюдения разных данных и столь разных оценок. Тем не менее, мы можем ожидать, что для разных выборок «в среднем» оценочный будет «правильным», если оценка будет объективной. Так что это было бы не всегда правильно, но «в среднем» было бы правильно. Это просто не всегда может быть «правильным» из-за случайности, связанной с данными.θ^n
Как уже отмечали другие, тот факт, что ваша оценка становится «ближе» к оценочной величине по мере роста вашей выборки, то есть что сходится по вероятности
имеет отношение к последовательности , а не объективности. Только объективность ничего не говорит нам о размере выборки и ее связи с полученными оценками. Более того, объективные оценки не всегда доступны и не всегда предпочтительнее, чем объективные . Например, после рассмотрения компромисса с отклонением от отклонения вы можете рассмотреть возможность использования оценщика с большим отклонением, но с меньшим отклонением - так что «в среднем» оно будет дальше от истинного значения, но чаще (меньшее отклонение) оценки будут быть ближе к истинному значению, тогда в случае объективной оценки.
источник
Во-первых, вы должны отличать предвзятость от статистической предвзятости, особенно для непрофессионала.
Выбор, скажем, использования медианы, среднего значения или режима в качестве оценщика для среднего населения , часто содержит политическую, религиозную или научную предубежденность теории. Вычисление того, какая оценка является наилучшей формой среднего значения, отличается от арифметики, которая влияет на статистическое смещение.
Как только вы преодолели смещение выбора метода, вы можете устранить потенциальные смещения в методе оценки. Сначала вы должны выбрать метод, который может иметь смещение, и механизм, который легко ведет к этому смещению.
Может быть проще использовать точку зрения «разделяй и властвуй», где это становится очевидным, когда размер выборки уменьшается, оценка становится явно смещенной. Например, коэффициент n-1 (против 'n') в оценках разброса выборки становится очевидным, когда n падает с 3 до 2 к 1!
Все зависит от того, насколько «лежал» человек.
источник