Как проверить эффект взаимодействия с помощью непараметрического теста (например, тест перестановки)?

10

У меня есть две категориальные / номинальные переменные. Каждое из них может принимать только два разных значения (итого, у меня всего 4 комбинации).

Каждая комбинация значений поставляется с набором числовых значений. Итак, у меня есть 4 набора чисел. Чтобы сделать его более конкретным, допустим, что у меня есть male / femaleи young / oldв качестве номинальных переменных, и weightв качестве зависимого числового «выхода».

Я знаю, что переход от maleк femaleдействительно изменяет средний вес, и эти изменения статистически значимы. Итак, я могу рассчитать genderкоэффициент. То же самое относится и к ageпеременной. Я знаю, что переход от youngк oldдействительно изменяет средний вес, и я могу рассчитать соответствующий ageкоэффициент.

Теперь, что я действительно хочу увидеть, подтверждают ли данные, что переход от молодых женщин к старым мужчинам - это больше, чем комбинация гендерных и возрастных факторов. Другими словами, я хочу знать, подтверждают ли данные наличие «2D-эффектов» или, другими словами, возрастные и гендерные эффекты не являются независимыми. Например, может случиться так, что старение для мужчин увеличивает вес в 1,3 раза, а для женщин соответствующий коэффициент составляет 1,1.

Конечно, я могу рассчитать два упомянутых фактора (возрастной фактор для мужчин и возрастной фактор для женщин), и они различны. Но я хочу рассчитать статистическую значимость этой разницы. Насколько реальна эта разница?

Я хотел бы сделать непараметрический тест, если это возможно. Можно ли сделать то, что я хочу сделать, смешав четыре сета, перетасовав их, заново разделив и вычислив что-то.

Роман
источник
2
Одна из трудностей, связанных с непараметрическим взаимодействием, заключается в том, что монотонное преобразование ответа может устранить имеющееся взаимодействие, вызвать взаимодействие там, где оно отсутствует, или изменить направление взаимодействия. Это говорит о том, что подходы, основанные на рангах, например, могут не делать то, что вы ожидаете от них.
Glen_b
С тестами перестановки исходных переменных у вас нет этой проблемы, но оказывается, что нет точных тестов для взаимодействия. Вы можете получить приблизительные тесты.
Glen_b

Ответы:

5

Есть непараметрические тесты на взаимодействие. Грубо говоря, вы заменяете наблюдаемые веса на их ранги и обрабатываете результирующий набор данных как гетероскедастический ANOVA. Посмотрите, например, на «Непараметрические методы в факторных планах» Бруннера и Пури (2001).

Однако интересующий вас вид непараметрического взаимодействия не может быть показан в этой общности. Вы сказали:

Другими словами, я хочу знать, подтверждают ли данные наличие «2D-эффектов» или, другими словами, возрастные и гендерные эффекты не являются независимыми. Например, может случиться так, что старение для мужчин увеличивает вес в 1,3 раза, а для женщин соответствующий коэффициент составляет 1,1.

Последнее невозможно. Непараметрическое взаимодействие должно включать изменение знака, то есть старение увеличивает вес мужчин, но уменьшает вес женщин. Такое изменение знака сохраняется, даже если вы монотонно преобразуете веса. Но вы можете выбрать монотонное преобразование данных, которое отображает увеличение веса в 1.1 раза настолько близко, насколько вы хотите, к 1.3. Конечно, вы никогда не покажете разницу существенной, если она может быть настолько близкой, насколько вы хотите.

Если вы действительно заинтересованы во взаимодействиях без смены знака, вам следует придерживаться обычного параметрического анализа. Там монотонные преобразования, которые «поглощают разницу», не допускаются. Конечно, это опять-таки нужно учитывать при моделировании и интерпретации вашей статистики.

Хорст Грюнбуш
источник
1

weighti=αagei+βgenderi+γ(genderiagei).γКоэффициент фиксирует размер «2D» эффекта возраста и пола. Вы можете проверить t-статистику чтобы получить приблизительное представление о том, значительно ли , наблюдаемая в вашей модели, отличается от .γγγ=0

Вот очень грубый графический пример, чтобы показать, что делает этот дополнительный мультипликативный термин .genderiagei

В модели мы, по сути, пытаемся приспособить простую гиперплоскость к даннымresponse=x1+x2

введите описание изображения здесь

Эта модель является линейной в ковариатах, поэтому линейную форму вы видите на графике выше.

С другой стороны, модели является нелинейным по и и, следовательно, допускает некоторый уровень кривизныresponse=x1+x2+x1x2x1x2

введите описание изображения здесь

Неспособность отвергнуть гипотезу о том, что равно что не отвергнуть наличие некоторой кривизны этой формы в модели.γ=0

С точки зрения непараметрического теста вы можете сделать что-то в соответствии с тем, что вы предложили, получив стандартные ошибки начальной загрузки для . Это означает, что несколько раз вы: 1) выбираете данные с заменой, 2) пересчитываете линейный режим, 3) получаете оценку . После множества оценок вы можете использовать квантиль чтобы установить непараметрический доверительный интервал для . Подробнее об этом, Google "загрузите стандартные ошибки".gamma & gamma 50 ± р % 2 р % & gammaγγ^γ^50±p%2p%γ

Мустафа С Эйса
источник
Как это может быть нелинейным, если x1 и x2 могут принимать значения только 0 или 1? Как бы гамма в вашем примере объяснила любую форму кривизны?
5
αR2:x1+x2+x1x2=i=12αixi
Однако я добавлю, что когда домен является двоичным (что похоже на вершины двумерного куба), вы можете обрабатывать эту функцию линейно. Но функциональная форма строго нелинейна.
Мустафа С Эйса
@MustafaMEisa, я никогда не видел члена взаимодействия в линейной модели, который объясняется в терминах «вершин двумерного куба». Было бы информативно, если бы вы могли уточнить.
5
@ HorstGrünbusch, мне также интересно узнать ваш комментарий к этому ответу, так как вы уже дали полезный комментарий к моему ответу.
5
1

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+b3age

gender=0age=0gender=1age=1gender=0age=1gender=1age=0

wt=α+b1young.male+b2old.male+b3young.female+ϵ

old.femaleb1old.femaleyoung.maleαwtold.female

Таким образом, приведенные выше примеры являются слишком сложным способом прийти к такому выводу (что мы на самом деле просто сравниваем четыре групповых значения), но для изучения того, как работают взаимодействия, я думаю, что это полезное упражнение. В CV есть и другие очень хорошие посты о взаимодействии непрерывной переменной с номинальной переменной или взаимодействии двух непрерывных переменных. Даже если ваш вопрос был отредактирован для указания непараметрических тестов, я думаю, что полезно продумать вашу проблему с помощью более традиционного (то есть параметрического) подхода, поскольку большинство непараметрических подходов к проверке гипотез имеют ту же логику, но обычно меньше предположений о конкретных распределениях.

wt

old.menyoung.women

Коротко об «значительных» взаимодействиях

x1x2x1x2Но еще раз, если у нас есть только два ковариаты, которые могут принимать значения только 0 или 1, это означает, что мы в основном смотрим на четыре групповых средних.

Работал пример

Давайте сравним результаты модели взаимодействия с результатами теста Данна. Во-первых, давайте сгенерируем некоторые данные, в которых (а) мужчины весят больше, чем женщины, (б) мужчины младшего возраста весят меньше, чем мужчины старшего возраста, и (в) нет разницы между женщинами более молодого и старшего возраста.

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

wt

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

Нужно рассчитать стандартную ошибку или доверительный интервал для вашего предельного эффекта? Пакет «эффектов», упомянутый выше, может сделать это для вас, но еще лучше, Aiken и West (1991) дают вам формулы, даже для гораздо более сложных моделей взаимодействия. Их таблицы удобно напечатаны здесь , наряду с очень хорошим комментарием Мэтта Голдера.

Теперь, чтобы реализовать тест Данна.

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

Значение р в результате критерия хи-квадрат Крускала-Уоллиса предполагает, что по крайней мере одна из наших групп «принадлежит к другой популяции». Для групповых сравнений верхнее число представляет собой статистику z-критерия Данна, а нижнее число представляет собой значение p, которое было скорректировано для множественных сравнений. Поскольку данные нашего примера были довольно искусственными, неудивительно, что у нас так много маленьких p-значений. Но обратите внимание на сравнение справа внизу между молодыми и пожилыми женщинами. Тест правильно поддерживает нулевую гипотезу о том, что между этими двумя группами нет различий.

ОБНОВЛЕНИЕ: Учитывая другие ответы, этот ответ был обновлен, чтобы оспорить идею, что это требует любой формы нелинейного моделирования, или что - учитывая конкретный пример OP двух бинарных ковариат, то есть четырех групп, - что должен быть изменение знака оценивает это непараметрически. Например, если бы возраст был непрерывным, были бы другие способы решения этой проблемы, но это был не тот пример, который был дан OP.

5ayat
источник
Вы не используете структуру двух скрещенных факторов. Вы просто сравниваете четыре группы. Тест Данна вовсе не о взаимодействии.
Хорст Грюнбуш
Согласен, тест Данна не о взаимодействии. Однако вопрос конкретно касается взаимодействия двух двоичных переменных. Мой ответ демонстрирует, как это эквивалентно сравнению четырех групп. Если условия взаимодействия являются новыми для OP, надеюсь, это полезная иллюстрация.
5
1

Итак, у вас есть эти случайные величины:

  • AN
  • S{male,female}
  • W]0,[

И у вас есть эти функции вероятности масса / плотность:

  • fWW
  • fW,AW,A
  • fW,SW,S
  • fW,A,SW,A,S

was

  • fW,A(w,a)fW(w)
  • fW,S(w,s)fW(w)

fW,A,S(w,a,s)fW,A(w,a)fW,S(w,s)

was

Тем не менее, вы не знаете настоящие совместные PDF-файлы выше. Поскольку вы хотите ограничить себя непараметрическими методами, ваша задача сейчас состоит в том, чтобы найти эти непараметрические оценки:

  • f^W,A(w,a)
  • f^W,S(w,s)
  • f^W,A,S(w,a,s)

А потом покажи, что:

  • Ваши оценки плотности достаточно точны.
  • f^W,A,S(w,a,s)f^W,A(w,a)f^W,S(w,s)
  • f^W,A,S(w,a,s)=f^W,A(w,a)=f^W,S(w,s)
троглодит
источник
0

Это будет проверка эффектов взаимодействия . Линейное моделирование могло бы проверить такую ​​вещь, но оно не является непараметрическим, поэтому я думаю, что нужно использовать другой инструмент.

Как вы проверки вашего ageи genderэффекта до сих пор?

РЕДАКТИРОВАТЬ: Этот ответ выглядит, как будто это поможет вам

Riff
источник