Сравнение дисперсии парных наблюдений

16

У меня есть парных наблюдений ( X i , Y i ), взятых из общего неизвестного распределения, которое имеет конечные первый и второй моменты и симметрично относительно среднего.NИксяYя

Пусть стандартное отклонение X (безусловное на Y ), а σ Y то же самое для Y. Я хотел бы проверить гипотезу σИксИксYσY

: σ X = σ YH0σX=σY

: σ Xσ YH1σXσY

Кто-нибудь знает о таком тесте? В первом анализе я могу предположить, что распределение нормальное, хотя общий случай более интересен. Я ищу решение в закрытой форме. Bootstrap - это всегда последнее средство.

с промежутками
источник
3
Я не уверен, почему информация о том, что наблюдения сопряжены, важна для проверяемой гипотезы; могли бы вы объяснить?
Расселпирс
1
@drknexus это важно, потому что зависимость затрудняет калибровку теста Фишера.
Робин Жирар

Ответы:

4

Вы можете использовать тот факт, что распределение выборочной дисперсии представляет собой распределение хи-квадрат с центром в истинной дисперсии. Согласно вашей нулевой гипотезе, вашей тестовой статистикой будет разница двух случайных величин хи-квадрат с центром в одной и той же неизвестной истинной дисперсии. Я не знаю, является ли разница двух случайных величин хи-квадрат идентифицируемым распределением, но вышеприведенное может в некоторой степени помочь вам.


источник
3
@svadali здесь более привычно использовать коэффициент, так как распределение коэффициентов квадрата хи сведено в таблицу (F Fisher). Тем не менее, проблемная часть вопроса (то есть зависимость между и Y ) все еще там, что вы используете. Не просто построить тест с двумя зависимыми квадратами хи ... Я попытался дать ответ с решением по этому вопросу (см. Ниже). ИксY
Робин Джирард
7

Если вы хотите пойти по непараметрическому маршруту, вы всегда можете попробовать тест на квадраты рангов.

Для непарного случая, предположения для этого теста (взяты отсюда ):

  1. Обе выборки являются случайными выборками из их соответствующих популяций.
  2. В дополнение к независимости в каждом образце существует взаимная независимость между двумя образцами.
  3. Шкала измерения составляет как минимум интервал.

Эти лекционные заметки подробно описывают непарный случай.

Для парного случая вам придется немного изменить эту процедуру. На полпути вниз по этой странице вы получите представление о том, с чего начать.

csgillespie
источник
6

Наиболее простой подход я могу думать о том , чтобы регрессировать против X я , как Y я ~ м X я + б , а затем выполнить т -test на гипотезе т = 1 . См t-критерий для наклона регрессииYiXiYim^Xi+b^tm=1 .

Ui=XiYi,Vi=Xi+Yi,UiVi преобразование Fisher RZ , которое дает доверительные интервалы вокруг выборочного коэффициента Пирсона, или с помощью начальной загрузки.)

Если вы используете R и не хотите кодировать все самостоятельно, я бы использовал bootdpciпакет Robust Stats от Wilcox, WRS. (см. страницу Уилкокса .)

shabbychef
источник
4

Если вы можете предполагать двумерную нормальность, то вы можете разработать тест отношения правдоподобия, сравнивающий две возможные структуры ковариационных матриц. Неограниченные (H_a) оценки максимального правдоподобия хорошо известны - только выборочная ковариационная матрица, ограниченные (H_0) могут быть получены путем выписывания вероятности (и, вероятно, будет своего рода «объединенной» оценкой).

Если вы не хотите выводить формулы, вы можете использовать SAS или R для подбора модели с повторными измерениями с неструктурированными и составными симметричными ковариационными структурами и сравнения вероятностей.

Анико
источник
3

Трудность явно приходит потому, что Икс и Y коррелированы (я предполагаю, (Икс,Y) является совместно гауссовским, как Анико), и вы не можете сделать разницу (как в ответе @ svadali) или соотношение (как в стандартном F-тесте Fisher-Snedecor), потому что они будут зависимыми χ2 распределение, и потому что вы не знаете, что это за зависимость, которая затрудняет вывод распределения под ЧАС0,

Мой ответ основан на уравнении (1) ниже. Поскольку разница в дисперсии может быть разложена на множители с разностью собственных значений и разницей в угле поворота, критерий равенства можно отклонить на два критерия. Я показываю, что можно использовать тест Фишера-Снедекора вместе с тестом на склоне, например, предложенным @shabbychef, из-за простого свойства двухмерных гауссовских векторов.

Тест Фишера-Снедекора: если дляi=1,2 (Z1i,,Znii) iid gaussian random variables with empirical unbiased variance λ^i2 and true variance λi2, then it is possible to test if λ1=λ2 using the fact that, under the null,

It uses the fact that

R=λ^X2λ^Y2
follows a Fisher-Snedecor distribution F(n11,n21)

A simple property of 2D gaussian vector Let us denote by

R(θ)=[cosθsinθsinθcosθ]
It is clear that there exists λ1,λ2>0 ϵ1, ϵ2 two independent gaussian N(0,λi2) such that

[XY]=R(θ)[ϵ1ϵ2]
and that we have
Var(X)Var(Y)=(λ12λ22)(cos2θsin2θ)[1]

Testing of Var(X)=Var(Y) can be done through testing if ( λ12=λ22 or θ=π/4mod[π/2])

Conclusion (Answer to the question) Testing for λ12=λ22 is easely done by using ACP (to decorrelate) and Fisher Scnedecor test. Testing θ=π/4[modπ/2] is done by testing if |β1|=1 in the linear regression Y=β1X+σϵ (I assume Y and X are centered).

Testing wether (λ12=λ22 or θ=π/4[modπ/2]) at level α is done by testing if λ12=λ22 at level α/3 or if |β1|=1 at level α/3.

robin girard
источник