У меня есть два образца данных, базовый образец и образец лечения.
Гипотеза состоит в том, что образец лечения имеет более высокое среднее значение, чем базовый образец.
Оба образца имеют экспоненциальную форму. Поскольку данные довольно велики, у меня есть только среднее значение и количество элементов для каждого образца на момент проведения теста.
Как я могу проверить эту гипотезу? Я предполагаю, что это очень просто, и я столкнулся с несколькими ссылками на использование F-теста, но я не уверен, как отображаются параметры.
hypothesis-testing
statistical-significance
exponential
Джонатан Добби
источник
источник
Ответы:
Вы можете проверить равенство средних параметров по сравнению с альтернативой, что средние параметры не равны, с помощью теста отношения правдоподобия (тест LR). (Однако, если средние параметры различаются, а распределение экспоненциально, это смещение масштаба, а не смещение местоположения.)
Для теста с одним хвостом (но только асимптотически в случае с двумя хвостами) я полагаю, что тест LR оказывается эквивалентным следующему (чтобы показать, что это на самом деле то же самое, что тест LR для одностороннего теста В случае, если нужно было бы показать, что статистика LR была монотонной в ):x¯/y¯
Допустим, мы параметризовали е наблюдение в первой экспоненте как имеющее pdf а е наблюдение во втором примере - как pdf (над очевидными областями для наблюдений и параметров). (Чтобы было ясно, мы работаем в средней форме, а не в форме ставки здесь; это не повлияет на результат расчетов.)1 / μ x exp ( - x i / μ x ) j 1 / μ y exp ( - y j / μ y )i 1/μxexp(−xi/μx) j 1/μyexp(−yj/μy)
Поскольку распределение является частным случаем гаммы, , распределение суммы ', является распределенным ; аналогично, что для суммы s, равно .Xi Γ(1,μx) X Sx Γ(nx,μx) Y Sy Γ(ny,μy)
Из-за связи между гамма-распределениями и распределениями хи-квадрат получается, что распределен . Соотношение двух хи-квадратов по степеням свободы равно F. Следовательно, отношение .2/μxSx χ22nx μyμxSx/nxSy/ny∼F2nx,2ny
В соответствии с нулевой гипотезой равенства средних значений, и при двусторонней альтернативе значения могут иметь тенденцию быть либо меньшими, либо большими, чем значение из нулевого дистрибутива, так что вам нужен двусторонний тест.x¯/y¯∼F2nx,2ny
Симуляция, чтобы проверить, что мы не сделали какую-то простую ошибку в алгебре:
Здесь я смоделировал 1000 выборок размера 30 для и 20 для из экспоненциального распределения с тем же средним значением и вычислил вышеупомянутую статистику отношения средних величин.X Y
Ниже приведена гистограмма полученного распределения, а также кривая, показывающая распределение мы вычислили под нулем:F
Пример с обсуждением вычисления двухсторонних p-значений :
Чтобы проиллюстрировать расчет, вот две маленькие выборки из экспоненциальных распределений. X-выборка имеет 14 наблюдений из популяции со средним значением 10, Y-выборка имеет 17 наблюдений из популяции со средним значением 15:
Средние значения выборки составляют 12,082 и 16,077 соответственно. Соотношение средних составляет 0,7515
Область слева прямолинейна, поскольку находится в нижнем хвосте (вычислено в R):
Нам нужна вероятность для другого хвоста. Если бы распределение было симметричным в обратном направлении, это было бы просто сделать это.
Общепринятым соглашением с F-тестом отношения дисперсий (который аналогично двухстороннему) является просто удвоение одностороннего p-значения (фактически то, что происходит, как здесь ; это также, как кажется, делается в R, например). ); в этом случае он дает значение р 0,44.
Однако, если вы сделаете это с формальным правилом отклонения, поместив область в каждый хвост, вы получите критические значения, как описано здесь . Тогда значение p является наибольшим значением которое может привести к отклонению, что эквивалентно добавлению вышеупомянутого p-значения с одним хвостом к одностороннему p-значению в другом хвосте для взаимозаменяемых степеней свободы. В приведенном выше примере это дает значение р 0,43.α/2 α
источник
В качестве дополнения к ответу @ Glen_b отношение правдоподобия составляет который вы можете переупорядочить в где . Существует один минимум при , поэтому F-критерий действительно является тестом отношения правдоподобия для односторонних альтернатив нулевой гипотезе идентичных распределений.
Чтобы правильно выполнить тест отношения правдоподобия для двусторонней альтернативы, вы все равно можете использовать F-распределение; вам просто нужно найти другое значение отношения выборочных средств для которого отношение правдоподобия равно наблюдаемому отношению , а затем . Для этого примера , & , что дает общее значение p, равное (довольно близко к значению , полученному в приближении хи-квадрат к распределение в два раза больше логарифмического отношения правдоподобия, ).rELR robs Pr(R>rELR) rELR=1.3272 Pr(R>rELR)=0.2142 0.4352 0.4315
Но удвоение одностороннего p-значения, возможно, является наиболее распространенным способом получения двухстороннего p-значения: оно эквивалентно нахождению значения отношения выборочных средних для которых хвостовая вероятность равно , а затем найти . Объясняется так, что может показаться, что тележку ставят перед лошадью, чтобы вероятности хвоста определяли экстремальность статистики теста, но это может быть оправдано тем, что в действительности действуют два односторонних теста (каждый LRT) с множественными сравнениями. исправление - и люди обычно заинтересованы в утверждении, что или Pr ( R > R E T P ) Pr ( R)rETP Pr(R>rETP) Рг ( Р > г Е Т Р ) μ х > μ у μ х < μ у μ х > μ у μ х < μ YPr(R<robs) Pr(R>rETP) μx>μy μx<μy μx>μy или . Это также меньше суеты, и даже для довольно небольших размеров выборки дает почти такой же ответ, как и сам двусторонний LRT.μx<μy
Код R следует:
источник