Я математик, самостоятельно изучающий статистику и особенно борющийся с языком.
В книге, которую я использую, есть следующая проблема:
Случайная переменная задается как распределяется с . (Конечно, для этого вопроса можно взять любое распределение в зависимости от одного параметра.) Затем приводится выборка из пяти значений , , , , .Парето ( α , 60 ) α > 0 14 21 6 32 2
Первая часть: «Использование метода максимального правдоподобия, найти оценку из на основе [образец].» Это не было проблемой. Ответ: . ; & alpha ; & alpha ; ≈4,6931
Но затем: «Дайте оценку для стандартной ошибки ».
Что подразумевается под этим? Поскольку - это просто фиксированное действительное число, я не вижу, каким образом оно может иметь стандартную ошибку. Должен ли я определить стандартное отклонение ? Парето( α ,60)
Если вы думаете, что вопрос не ясен, эта информация также поможет мне.
источник
Ответы:
Другой ответ охватил происхождение стандартной ошибки, я просто хочу помочь вам с обозначениями:
Ваша путаница связана с тем, что в статистике мы используем точно такой же символ для обозначения оценщика (который является функцией) и конкретной оценки (которая является значением, которое оценщик принимает, когда получает в качестве входных данных конкретную реализованную выборку).
Таким образом , α = ч ( Х ) и α ( Х = х ) = 4,6931 для й = { 14 ,α^= ч ( х ) α^( Х = х ) = 4,6931 . Таким образом , α ( X ) является функцией случайных величин и так самой случайной величины, чтобезусловноимеет дисперсию. х ={14,21 ,6 ,32 ,2 } α^( X)
При оценке ML во многих случаях мы можем вычислить асимптотическую стандартную ошибку, поскольку распределение оценки по конечной выборке неизвестно (не может быть получено).
Строго не имеет асимптотическое распределение, так как она сходится к действительному числу (истинное число почти во всех случаях оценки ML). Но количество √α^ сходится к нормальной случайной величины (путем применения центральной предельной теоремы).N--√( α^- а )
Вторая точка нотационной путаницы : большинство, если не все тексты, будут писать ( «аварский» = асимптотическую дисперсию ") , а то , что они имели в виду это аварский ( √Авар ( α^) , то есть они относятся к асимптотической дисперсии величины √Аварец ( п--√( α^- а ) ) ,не альфа ... Для случая основного распределения Парето мы имеемN--√( α^- а ) α^
и так
(но то , что вы найдете написанное )Авар ( α^) = α2
Теперь, в каком смысле оценщик α имеет «асимптотическую дисперсию», так как сказано, асимптотически сходится к константе? Ну, в приблизительном смысле и для больших, но конечных выборок. Т.е. где-то между «малой» выборкой, где Оценщик является случайной величиной с (обычно) неизвестным распределением, и «бесконечной» выборкой, где оценщик является постоянной величиной, существует эта «большая, но конечная территория выборки», где Оценщик еще не стал константой, и где его распределение и дисперсия получены окольным путем, сначала используя Центральную предельную теорему, чтобы получить правильно асимптотическое распределение величины Z = √α^ (который является нормальным изза CLT), а затем повернуть вещи вокруг и писать α = 1Z= n--√( α^- а ) (при приеме один шаг назад и леченийпкак конечные)который показывает& alphaкачестве аффинной функции нормального случайной величиныZ, и поэтому обычно себя распределен (всегда приблизительно).α^= 1N√Z+ α N α^ Z
источник
- это оценка максимального правдоподобия - это функция случайной выборки, и поэтому также случайным(не фиксируется). Оценка стандартной ошибки & alpha ; может быть получена из информации Фишера,α^ α^
Где - параметр, а L ( θ | Y = y ) - логарифмическая функция правдоподобия θ, условная для случайной выборки y . Интуитивно понятно, что информация Фишера указывает крутизну кривизны логарифмической поверхности правдоподобия вокруг MLE и, таким образом, количество «информации», которую у обеспечивает около θ .θ L (θ | Y= у) θ Y Y θ
Для распределения с одной реализацией Y = y логарифмическая вероятность, где y 0 , известна:P a r e t o (α, y0) Y= у Y0
Подсоединение к определению информации Фишера, I(α)=1
источник