Могут ли случайные эффекты применяться только к категориальным переменным?

9

Эти вопросы могут показаться глупыми, но ... верно ли, что случайные эффекты могут применяться только к категориальным переменным (таким как индивидуальный идентификатор, идентификатор популяции, ...), например, скажем, является категориальной переменной:xi

β x iyi ~βxi

N o r m ( μ , δ 2 )βxi ~Norm(μ,δ2)

но из принципа случайный эффект не может применяться к непрерывной переменной (например, высота, масса ...), скажем, :zi

α + β z iyi ~α+βzi

потому что тогда есть только один коэффициент который не может быть ограничен? Звучит логично, но мне интересно, почему это никогда не упоминается в статистической литературе! Спасибо!β

РЕДАКТИРОВАТЬ: Но что, если я ограничить как ~ ? Это случайный эффект? Но это отличается от ограничения, которое я наложил на - здесь я ограничиваю переменную, тогда как в предыдущем примере я ограничил коэффициент ! Это начинает казаться мне большим беспорядком ... Во всяком случае, не имеет смысла ставить это ограничение, потому что - известные значения, поэтому, возможно, эта идея совершенно странная :-)z i N o r m ( μ , δ 2 ) β x i z iziziNorm(μ,δ2)βxizi

любознательный
источник
1
Интересный связанный вопрос: stats.stackexchange.com/q/61531/5509
Любопытный

Ответы:

5

Это хороший и очень простой вопрос.

Интерпретация случайных эффектов очень специфична для предметной области и зависит от выбора модели (статистическая модель или байесовский или частый). Очень хорошее обсуждение см. На стр. 245, Gelman and Hill (2007) . Для байесовского все случайное (даже если параметры могут иметь истинно фиксированное значение, они моделируются как случайные), и частый пользователь может также выбрать значение параметра как фиксированный эффект, который в противном случае был бы смоделирован как случайный (см. Casella, 2008 , обсуждение блоков, которые должны быть фиксированными или случайными в примере 3.2).

Изменить (после комментария)

Данные фиксируются после того, как вы их наблюдаете. Если они непрерывны, их следует смоделировать как непрерывные. Вы можете смоделировать категориальные переменные как категориальные, а иногда и как непрерывные (как в настройках порядковых переменных). Параметры неизвестны, и они могут быть смоделированы как фиксированные или случайные. Параметры по существу относятся к реакции на предикторы. Если вы хотите, чтобы наклон отдельного предиктора (или его коэффициент в линейной модели) варьировался для каждого ответа, смоделируйте его как случайный, в противном случае смоделируйте его как фиксированный. Точно так же, если вы хотите, чтобы перехват менялся в зависимости от группы, тогда они должны быть смоделированы как случайные; в противном случае они должны быть исправлены.

suncoolsu
источник
1
Спасибо за ваш ответ, но хммм ... Я поставил простой вопрос и ожидал какой-то простой или общий ответ :) Во втором абзаце вы утверждаете, что в байесовском все случайно. Пожалуйста, не усложняйте это слишком сильно :) Я специально спросил на уровне модели, пожалуйста, забудьте о частоте или байесовском - меня интересует принцип - для какого типа переменных обычно используются случайные эффекты?
любопытно
В третьем абзаце вы помещаете специальное приложение с временными рядами, я не уверен, что понимаю это, но временные ряды AFAIK обычно бывают дискретными (не непрерывными), если вы говорите о последовательной корреляции ... В любом случае, если у вас есть как-то более общее ответьте, пожалуйста, поделитесь. Еще раз спасибо за ответ!
Любопытно
Случайность в неизвестных вещах. Когда у вас есть наблюдения, они известны! Единственное, что вы знаете, это ваши данные. Неизвестными являются параметры, и они могут быть смоделированы как случайные или фиксированные. (извините за путаницу; я согласен, я излишне усложнил ситуацию.)
suncoolsu
спасибо за упрощение вашего ответа. Итак, дошел до корня моего вопроса - значит ли это, что ответ « да» , то есть случайные эффекты применяются только к категориальным переменным, потому что случайные эффекты применяются только к параметрам (не к данным) и только к параметрам, которые можно смоделировать? Насколько случайны те, которые имеют несколько уровней, то есть категории категориальной переменной? И параметры непрерывных переменных не могут быть смоделированы как случайные, потому что существует только 1 значение параметра для непрерывной переменной? Спасибо!
Любопытно
В вашей конкретной ситуации ответ - ДА . Но в целом ответ, я бы сказал, НЕТ, потому что непрерывные переменные могут варьироваться в зависимости от группы. Например, доход жителей города должен быть выше, чем в деревне (по вашему мнению, это могут быть две отдельные категориальные переменные для местоположения).
Suncoolsu
3

Возможно, ваш вопрос уже решен, но на самом деле он записан в учебнике;

Случайные эффекты - это категориальные переменные, уровни которых рассматриваются как выборка из некоторого более крупного населения, в отличие от фиксированных эффектов, уровни которых представляют интерес сами по себе,

на странице 232: Алан Графен и Рози Хейлс (2002) «Современная статистика для наук о жизни», издательство Оксфордского университета.

саппоро
источник
2
Это все правда, но я не думаю, что это отвечает на вопрос.
Патрик Куломб
1
Я не согласен с вышеупомянутым комментарием @PatrickCoulombe, я думаю, что это точно отвечает на вопрос. +1.
амеба
1

Я думаю, проблема в том, что здесь есть две вещи. Типичным примером случайных эффектов может быть прогноз среднего балла (GPA) студента колледжа на основе ряда факторов, включая их средний балл в серии тестов в старшей школе.

Средний балл непрерывен . Как правило, у вас будет различный перехват или перехват и наклон для среднего балла для каждого человека. Индивид явно категоричен .

Поэтому, когда вы говорите «относится только к категориальным переменным», это немного расплывчато. Скажем, вы рассматриваете только случайный перехват для среднего балла. В этом случае ваш случайный перехват для непрерывной величины и на самом деле, вероятно, моделируется как нечто вроде гауссовой переменной со средним и стандартным отклонением, которое определяется процедурой. Но этот случайный перехват определяется среди группы студентов, где каждый студент идентифицируется категориальной переменной.

Вы можете использовать «непрерывную» переменную вместо идентификатора студента. Может быть, вы могли бы выбрать рост студента. Но по сути это должно рассматриваться как категоричное. Если бы ваши измерения высоты были очень точными, вы бы в конечном итоге получили уникальный рост для каждого ученика, поэтому ничего бы не достигли. Если бы ваши измерения роста были не очень точными, вы бы в итоге объединили несколько учеников на каждой высоте. (Смешивание их оценок возможно плохо определенным способом.)

Это своего рода противоположность взаимодействия. Во взаимодействии вы умножаете две переменные и по существу рассматриваете обе как непрерывные. Категориальная переменная будет разбита на набор фиктивных переменных 0/1, а 0 или 1 умножится на другую переменную во взаимодействии.

Суть в том, что «случайный эффект» в некотором смысле является просто коэффициентом, который имеет распределение (моделируется), а не фиксированное значение.

Wayne
источник
Пожалуйста, войдите под своей основной учетной записью, чтобы иметь возможность редактировать.
амеба