Какое распределение предполагает точный тест Фишера?

11

В своей работе я видел несколько применений точного теста Фишера, и мне было интересно, насколько хорошо он соответствует моим данным. Просматривая несколько источников, я понял, как рассчитать статистику, но так и не увидел четкого и формального объяснения предполагаемой нулевой гипотезы.

Может кто-нибудь объяснить или направить меня к формальному объяснению предполагаемого распределения? Будем благодарны за объяснение с точки зрения значений в таблице непредвиденных обстоятельств.

Амит Лавон
источник
3
В случае 2x2 он основан на гипергеометрическом распределении.
Glen_b

Ответы:

11

В случае дистрибутивный предположение задается двумя независимыми биномиальных случайных величин Х 1 ~ B я п ( п 1 , θ 1 ) и X 2 ~ B я п ( п 2 , θ 2 ) . Нулевой гипотезой является равенство θ 1 = θ 2 . Но точный критерий Фишера условный тест: он опирается на условное распределение X 1 данного X 12×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1 . Это распределение является гипергеометрическим распределением с одним неизвестным параметром: отношение шансов ψ = θ 1X1+X2 , и тогда нулевая гипотезаψ=1.ψ=θ11θ1θ21θ2ψ=1

Этот дистрибутив имеет свою страницу в Википедии .

Чтобы оценить это с помощью R, вы можете просто использовать формулу, определяющую условную вероятность:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

Или используйте dnoncenhypergeomфункцию MCMCpackпакета:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838
Стефан Лоран
источник
Спасибо @Stephane. Можете ли вы объяснить, почему он становится гипергеометрическим и каковы параметры?
Амит Лавон
2
Извините @AmitLavon, я не знаю подробностей об этом гипергеометрическом распределении.
Стефан Лоран
1
@AmitLavon Я только что отредактировал свой ответ, включив в него ссылку на Википедию и код R.
Стефан Лоран
10

χ2

  • Две переменные, оцениваемые для ассоциации, являются по-настоящему политомными переменными типа «все или ничего», такими как мертвые / живые США / Европа. Если одна или обе переменные являются упрощением базового континуума, категорический анализ данных не должен проводиться вообще.
  • YXYY=yXxYX2×2Тест таблицы вероятностей предполагает, что каждый субъект, проходящий лечение А, имеет одинаковую вероятность смерти. [Можно утверждать, что это слишком строгое предположение, но эта позиция не признает потерю власти из-за проведения нескорректированных проверок ассоциации.]

χ2XYYPPχ2 P

Фрэнк Харрелл
источник
Спасибо @FrankHarrell. Можете ли вы дать ссылки на ваше утверждение о том, что P-значения хи-квадрат более точны, чем у Фишера?
Амит Лавон
1
Смотрите, например, citeulike.org/user/harrelfe/tag/fishers-exact-test . Это подробно обсуждалось на stackexchange.
Фрэнк Харрелл
к сожалению, ctiteulike исчез, и web.archive.org, похоже, только просканировал первую страницу аккаунта harrelfe.
Glen_b