Почему степени свободы для подобранных пар -тест количество пар минус 1?

9

Я привык знать "степени свободы" как , где у вас есть линейная модель \ mathbf {y} = \ mathbf {X} \ boldsymbol {\ beta} + \ boldsymbol {\ epsilon} с \ mathbf {y } \ in \ mathbb {R} ^ n , \ mathbf {X} \ in M_ {n \ times p} (\ mathbb {R}) проектная матрица с рангом r , \ boldsymbol {\ beta} \ in \ mathbb { R} ^ p , \ boldsymbol {\ epsilon} \ in \ mathbb {R} ^ n с \ boldsymbol {\ epsilon} \ sim \ mathcal {N} (\ mathbf {0}, \ sigma ^ 2 \ mathbf {I} _n) , \ sigma ^ 2> 0 .nr

y=Xβ+ϵ
yRnXMn×p(R)rβRpϵRnϵN(0,σ2In)σ2>0

Из того, что я вспоминаю об элементарной статистике (то есть, о предлинейных моделях с линейной алгеброй), степени свободы для t критерия согласованных пар - это число разностей минус 1 . Так что это может повлечь за собой X с рангом 1, возможно. Это правильно? Если нет, то почему n1 является степенью свободы для t критерия для согласованных пар ?

Чтобы понять контекст, предположим, у меня есть модель смешанных эффектов

yijk=μi+ some random effects+eijk
где i=1,2 , j=1,,8 и k=1,2 . В \ mu_i нет ничего особенного, μiкроме того, что это фиксированный эффект и eijkiidN(0,σe2) . Я предполагаю, что случайные эффекты не имеют отношения к этой проблеме, так как мы заботимся только о фиксированных эффектах в этом случае.

Я хотел бы указать доверительный интервал для \ mu_1 - \ mu_2μ1μ2 .

Я уже показал, что d¯=18dj является объективной оценкой μ1μ2 , где dj=y¯1jy¯2j , y¯1j=12ky1jk и y¯21 определяется аналогично. Оценка точки d¯ была вычислена.

Я уже показал, что

sd2=j(djd¯)281
является объективной оценкой дисперсии dj , и таким образом,
sd28
является стандартной ошибкой d¯ . Это было вычислено.

Теперь последняя часть выясняет степени свободы. Для этого шага я обычно пытаюсь найти матрицу проектирования - которая, очевидно, имеет ранг 2 - но у меня есть решение этой проблемы, и оно говорит, что степень свободы составляет .81

В контексте определения ранга проектной матрицы, почему степени свободы ?81

Отредактировано, чтобы добавить: Возможно, полезно в этом обсуждении, как определяется статистика теста. Предположим, у меня есть вектор параметров . В этом случае (если я что-то не совсем упустил). По сути, мы выполняем тест гипотезы где . Затем статистика теста определяется как который будет проверен на центральном -распределении сβ

β=[μ1μ2]
cβ=0
c=[11]
t=cβ^σ^2c(XX)1c
tnrстепени свободы, где - матрица проекта, как указано выше, и где .X
σ^2=y(IPX)ynr
PX=X(XX)1X
Кларнетист
источник

Ответы:

5

критерий совпадения пар с парами на самом деле представляет собой критерий с одной выборкой с размером выборки . У вас есть отличий , и они iid и обычно распространяются. Первый столбец после содержитtntnnd1,,dn

[d1dn]=[d¯d¯]+[d1d¯d1d¯]n d.f.1 d.f.(n1) d.f.
=''1степень свободы из-за линейного ограничения, которое говорит, что все записи равны; вторая имеет степеней свободы из-за линейного ограничения, которое говорит, что сумма записей равна .n10
Майкл Харди
источник
Итак, другими словами, причина, по которой у нас здесь степеней свободы, не имеет ничего общего с линейной моделью ? n1y=Xβ+ϵ
Кларнетист
1
Это имеет отношение к той модели, где матрица является столбцом с, а является матрицей , единственной записью которой является разница между двумя средними значениями. X1β1×1
Майкл Харди
2
Ага! Итак, ваш вектор был бы тем вектором s, правильно? Большое спасибо! Я не могу поверить, как тяжело было найти ответ на этот вопрос! ydi
Кларнетист
Да. Это вектор наблюдаемых различий в совпадающих парах. n
Майкл Харди
2

Большое, большое спасибо Майклу Харди за ответ на мой вопрос.

Идея заключается в следующем: let и . Тогда наша линейная модель имеет вид где является вектором всех единиц, и Очевидно, имеет ранг , поэтому у нас есть степеней свободы ,

y=[d1dn]
β=[μ1μ2]
y=1n×1β+ϵ
1n×1n
ϵ=[ϵ1ϵn]N(0,σ2In).
X=1n×11n1

Как мы знаем, чтобы установить равным ? Напомним, что и, как легко увидеть, для всех . Учитывая наш , очевидно, каким должен быть . Это потому что β[μ1μ2]

E[y]=Xβ
E[dj]=μ1μ2jXβ
E[y]=E[[d1dn]]=[E[d1]E[dn]]=[μ1μ2μ1μ2]=Xβ=1n×1β=[11]β
so должна быть матрицей с .β1×1β=[μ1μ2]

Установите . Тогда наш тест гипотезы будет Таким образом, наша статистика теста будет У нас есть После некоторой работы можно показать, что Также можно показать, чтоc=[1]

H0:cβ=0.
cβ^σ^2c(XX)1c.
σ^2=y(IPX)ynr(X).
PX=P1n×1=1n×1(1n)1.
IPXсимметрична и идемпотентна. Итак, и
σ^2=y(IPX)ynr(X)=y(IPX)(IPX)ynr(X)=(IPX)y2nr(X)=[I1n×1(1n)1]y2n1=[d1dn][d¯d¯]2n1=i=1n(did¯)2n1=sd2
XX=1n×11n×1=n
который, очевидно, имеет обратное , что дает тестовую статистику которая будет проверена на центральном -распределении с степенью свобода по желанию.1/n
μ^1μ^2sd2/n
tn1
Кларнетист
источник