Эти вопросы могут показаться глупыми, но ... верно ли, что случайные эффекты могут применяться только к категориальным переменным (таким как индивидуальный идентификатор, идентификатор популяции, ...), например, скажем, является категориальной переменной:
β x i ~
N o r m ( μ , δ 2 ) ~
но из принципа случайный эффект не может применяться к непрерывной переменной (например, высота, масса ...), скажем, :
α + β ⋅ z i ~
потому что тогда есть только один коэффициент который не может быть ограничен? Звучит логично, но мне интересно, почему это никогда не упоминается в статистической литературе! Спасибо!
РЕДАКТИРОВАТЬ: Но что, если я ограничить как ~ ? Это случайный эффект? Но это отличается от ограничения, которое я наложил на - здесь я ограничиваю переменную, тогда как в предыдущем примере я ограничил коэффициент ! Это начинает казаться мне большим беспорядком ... Во всяком случае, не имеет смысла ставить это ограничение, потому что - известные значения, поэтому, возможно, эта идея совершенно странная :-)z i N o r m ( μ , δ 2 ) β x i z i
источник
Ответы:
Это хороший и очень простой вопрос.
Интерпретация случайных эффектов очень специфична для предметной области и зависит от выбора модели (статистическая модель или байесовский или частый). Очень хорошее обсуждение см. На стр. 245, Gelman and Hill (2007) . Для байесовского все случайное (даже если параметры могут иметь истинно фиксированное значение, они моделируются как случайные), и частый пользователь может также выбрать значение параметра как фиксированный эффект, который в противном случае был бы смоделирован как случайный (см. Casella, 2008 , обсуждение блоков, которые должны быть фиксированными или случайными в примере 3.2).
Изменить (после комментария)
Данные фиксируются после того, как вы их наблюдаете. Если они непрерывны, их следует смоделировать как непрерывные. Вы можете смоделировать категориальные переменные как категориальные, а иногда и как непрерывные (как в настройках порядковых переменных). Параметры неизвестны, и они могут быть смоделированы как фиксированные или случайные. Параметры по существу относятся к реакции на предикторы. Если вы хотите, чтобы наклон отдельного предиктора (или его коэффициент в линейной модели) варьировался для каждого ответа, смоделируйте его как случайный, в противном случае смоделируйте его как фиксированный. Точно так же, если вы хотите, чтобы перехват менялся в зависимости от группы, тогда они должны быть смоделированы как случайные; в противном случае они должны быть исправлены.
источник
Возможно, ваш вопрос уже решен, но на самом деле он записан в учебнике;
на странице 232: Алан Графен и Рози Хейлс (2002) «Современная статистика для наук о жизни», издательство Оксфордского университета.
источник
Я думаю, проблема в том, что здесь есть две вещи. Типичным примером случайных эффектов может быть прогноз среднего балла (GPA) студента колледжа на основе ряда факторов, включая их средний балл в серии тестов в старшей школе.
Средний балл непрерывен . Как правило, у вас будет различный перехват или перехват и наклон для среднего балла для каждого человека. Индивид явно категоричен .
Поэтому, когда вы говорите «относится только к категориальным переменным», это немного расплывчато. Скажем, вы рассматриваете только случайный перехват для среднего балла. В этом случае ваш случайный перехват для непрерывной величины и на самом деле, вероятно, моделируется как нечто вроде гауссовой переменной со средним и стандартным отклонением, которое определяется процедурой. Но этот случайный перехват определяется среди группы студентов, где каждый студент идентифицируется категориальной переменной.
Вы можете использовать «непрерывную» переменную вместо идентификатора студента. Может быть, вы могли бы выбрать рост студента. Но по сути это должно рассматриваться как категоричное. Если бы ваши измерения высоты были очень точными, вы бы в конечном итоге получили уникальный рост для каждого ученика, поэтому ничего бы не достигли. Если бы ваши измерения роста были не очень точными, вы бы в итоге объединили несколько учеников на каждой высоте. (Смешивание их оценок возможно плохо определенным способом.)
Это своего рода противоположность взаимодействия. Во взаимодействии вы умножаете две переменные и по существу рассматриваете обе как непрерывные. Категориальная переменная будет разбита на набор фиктивных переменных 0/1, а 0 или 1 умножится на другую переменную во взаимодействии.
Суть в том, что «случайный эффект» в некотором смысле является просто коэффициентом, который имеет распределение (моделируется), а не фиксированное значение.
источник