PDF из

15

Предположим, что определены из с неизвестными иX1,X2,...,XnN(μ,σ2)μRσ2>0

Пусть S здесь стандартное отклонение.Z=X1X¯S,

Можно показать, что имеет Лебега pdfZ

f(z)=nΓ(n12)π(n1)Γ(n22)[1nz2(n1)2]n/22I(0,(n1)/n)(|Z|)

Тогда мой вопрос, как получить этот PDF?

Вопрос от здесь в примере 3.3.4 , чтобы найти UMVUE из . Я могу понять логику и процедуры, чтобы найти UMVUE, но не знаю, как получить PDF.P(X1c)

Я думаю , этот вопрос также относится к этому одному

Большое спасибо за помощь или указать на любые соответствующие ссылки будут также присвоены.

Глубокий Север
источник

Ответы:

14

Что такого интригующего в этом результате, так это то, насколько он похож на распределение коэффициента корреляции. Есть причина.


Предположим, что является двумерной нормой с нулевой корреляцией и общей дисперсией для обеих переменных. Нарисуйте пример iid . Хорошо известно и легко установить геометрически (как это сделал Фишер столетие назад), что распределение коэффициента корреляции выборки(X,Y)σ2(x1,y1),,(xn,yn)

r=i=1n(xix¯)(yiy¯)(n1)SxSy

является

f(r)=1B(12,n21)(1r2)n/22, 1r1.

(Здесь, как обычно, и являются выборочными средними и и являются квадратными корнями из дисперсии несмещенных оценок.) это бете - функция , для которойx¯y¯SxSyB

(1)1B(12,n21)=Γ(n12)Γ(12)Γ(n21)=Γ(n12)πΓ(n21).

Чтобы вычислить , мы можем использовать его инвариантность относительно вращений в вокруг линии, генерируемой , наряду с инвариантностью распределения выборки при тех же поворотах, и выберите для любого единичного вектора, компоненты которого суммируются с нулем. Один такой вектор пропорционален . Его стандартное отклонениеrRn(1,1,,1)yi/Syv=(n1,1,,1)

Sv=1n1((n1)2+(1)2++(1)2)=n.

Следовательно, должно иметь то же распределение, что иr

i=1n(xix¯)(viv¯)(n1)SxSv=(n1)x1x2xn(n1)Sxn=n(x1x¯)(n1)Sxn=nn1Z.

Поэтому все, что нам нужно, это изменить масштаб чтобы найти распределение :rZ

fZ(z)=|nn1|f(nn1z)=1B(12,n21)nn1(1n(n1)2z2)n/22

для . Формула (1) показывает, что это идентично вопросу.|z|n1n


Не совсем убежден? Вот результат моделирования этой ситуации 100 000 раз (при , где распределение равномерно).n=4

фигура

Первая гистограмма отображает коэффициенты корреляции а вторая гистограмма отображает коэффициенты корреляции для случайно выбранного вектор который остается фиксированным для всех итераций. Они оба одинаковы. QQ-график справа подтверждает, что эти распределения в основном идентичны.(xi,yi),i=1,,4(xi,vi),i=1,,4) vi

Вот Rкод, который создал сюжет.

n <- 4
n.sim <- 1e5
set.seed(17)
par(mfrow=c(1,3))
#
# Simulate spherical bivariate normal samples of size n each.
#
x <- matrix(rnorm(n.sim*n), n)
y <- matrix(rnorm(n.sim*n), n)
#
# Look at the distribution of the correlation of `x` and `y`.
#
sim <- sapply(1:n.sim, function(i) cor(x[,i], y[,i]))
hist(sim)
#
# Specify *any* fixed vector in place of `y`.
#
v <- c(n-1, rep(-1, n-1)) # The case in question
v <- rnorm(n)             # Can use anything you want
#
# Look at the distribution of the correlation of `x` with `v`.
#
sim2 <- sapply(1:n.sim, function(i) cor(x[,i], v))
hist(sim2)
#
# Compare the two distributions.
#
qqplot(sim, sim2, main="QQ Plot")

Ссылка

Р.А. Фишер. Распределение частот значений коэффициента корреляции в выборках из неопределенно большой популяции . Биометрика , 10 , 507. См. Раздел 3. (Цитируется в Продвинутой теории статистики Кендалла , 5-е издание, раздел 16.24.)

Whuber
источник
Ссылка на ссылку битая.
Секст Эмпирик
@ Martijn Спасибо за проверку. Я понимаю, что вы имеете в виду - ссылка работает, но она ни к чему не относится! Я исправил это.
whuber
4

Я хотел бы предложить этот способ, чтобы получить pdf для Z, непосредственно вычисляя MVUE для используя теорему Байеса, хотя это немного и сложно.P(Xc)

Так как и , являются совместной полной статистикой, MVUE для было бы так:E[I(,c)(X1)]=P(X1c)Z1=X¯Z2=S2P(Xc)

ψ(z1,z2)=E[I(,c)(X1)|z1,z2]=I(,c)fX|Z1,Z2(x1|z1,z2)dx1

Теперь, используя теорему Байеса, мы получаем

fX|Z1,Z2(x1|z1,z2)=fZ1,Z2|X1(z1,z2|x1)fX1(x1)fZ1,Z2(z1,z2)

Знаменатель можно записать в закрытом виде, поскольку , не зависят друг от друга.fZ1,Z2(z1,z2)=fZ1(z1)fZ2(z2)Z1N(μ,σ2n)Z2Γ(n12,2σ2n1)

Чтобы получить закрытую форму числителя, мы можем принять статистику:

W1=i=2nXin1
W2=i=2nXi2(n1)W12(n1)1

которое представляет собой среднее значение и выборочную дисперсию и они не зависят друг от друга, а также не зависят от . Мы можем выразить это через .X2,X3,...,XnX1Z1,Z2

W1=nZ1X1n1 ,W2=(n1)Z2+nZ12X12(n1)W12n2

Мы можем использовать преобразование, когда , X1=x1

fZ1,Z2|X1(z1,z2|x1)=nn2fW1,W2(w1,w2)=nn2fW1(w1)fW2(w2)

Поскольку , мы можем получить закрытую форму этого. Обратите внимание, что это верно только для который ограничивает до .W1N(μ,σ2n1)W2Γ(n22,2σ2n2)w20x1z1n1nz2x1z1+n1nz2

Так что сложите их вместе, экспоненциальные условия исчезнут, и вы получите,

fX|Z1,Z2(x1|z1,z2)=Γ(n12)πΓ(n22)nz2(n1)(1(n(x1z1)z2(n1))2)
где и ноль в другом месте.z1n1nz2x1z1+n1nz2

Исходя из этого, на данный момент мы можем получить PDF из используя преобразование.Z=X1z1z2

Кстати, MVUE будет выглядеть следующим образом: а и будет 1, если

ψ(z1,z2)=Γ(n12)πΓ(n22)π2θccosn3θdθ
θc=sin1(n(cz1)(n1)z1)cz1+n1nz2

Я не являюсь носителем английского языка, и могут быть некоторые неловкие предложения. Я изучаю статистику самостоятельно с введением учебника в математическую статистику Хогга. Таким образом, могут быть некоторые грамматические или математические концептуальные ошибки. Было бы полезно, если бы кто-то исправил их.

Спасибо за чтение.

KDG
источник