Тест Фишера в R

11

Предположим, у нас есть следующий набор данных:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Если я запускаю точный тест Фишера в R, то что alternative = greater(или меньше) подразумевается? Например:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Я получаю p-value = 0.01588и odds ratio = 3.943534. Кроме того, когда я переворачиваю строки таблицы сопряженности, как это:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

тогда я получаю p-value = 0.9967и odds ratio = 0.2535796. Но когда я запускаю таблицу двух непредвиденных обстоятельств без альтернативного аргумента (т. Е. fisher.test(mat)), Я получаю p-value = 0.02063.

  1. Не могли бы вы объяснить мне причину?
  2. Кроме того, что является нулевой гипотезой и альтернативной гипотезой в вышеупомянутых случаях?
  3. Могу ли я запустить тест Фишера для таблицы непредвиденных обстоятельств следующим образом:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS: я не статистика. Я пытаюсь изучать статистику, чтобы ваша помощь (ответы на простом английском) была бы высоко оценена.

Снейпу
источник

Ответы:

11

greater(или less) относится к одностороннему тесту, сравнивающему нулевую гипотезу p1=p2с альтернативой p1>p2(или p1<p2). Напротив, двусторонний тест сравнивает нулевые гипотезы с альтернативой, которая p1не равна p2.

Для вашей таблицы доля людей, сидящих на диете, составляет 1/4 = 0,25 (10 из 40) в вашей выборке. С другой стороны, доля мужчин, не сидящих на диете, составляет 1/13 или (5 из 65), равную 0,077 в выборке. Таким образом, оценка для p1составляет 0,25 и для p20,077. Поэтому кажется, что p1>p2.

Вот почему для односторонней альтернативы p1>p2значение p составляет 0,01588. (Небольшие p-значения указывают на то, что нулевая гипотеза маловероятна, а альтернатива вероятна.)

Когда альтернативой является p1<p2то, что мы видим, что ваши данные указали, что разница в неправильном (или непредвиденном) направлении.

Вот почему в этом случае значение р является настолько высоким 0,9967. Для двусторонней альтернативы значение p должно быть немного выше, чем для односторонней p1>p2. И действительно, это с р-значением, равным 0,02063.

Майкл Р. Черник
источник
1
Фантастическое объяснение. Итак, точный тест Фишера фактически сравнивает вероятности между строками, а не столбцами?
Кристиан
@Christian: Нет, не имеет значения, проверяют ли его строки или столбцы в тесте Фишера на наличие корреляции в таблице непредвиденных обстоятельств. Строки и столбцы не имеют значения напрямую. Вы можете также переформулировать гипотезу: вместо H0, «люди, которые курят, умирают моложе», вы также можете предположить, что H0: «люди, которые умирают моложе, чаще курят». Результаты теста Фишера скажут вам, поддерживает ли какое-либо наблюдаемое соединение в данных нулевую гипотезу или нет, но не имеет значения, какая переменная является независимой или зависимой, и в равной степени выбор строк / столбцов не имеет значения: )
Доминик Поль