Могут ли (должны?) Методы регуляризации использоваться в модели случайных эффектов?

11

Под методами регуляризации я имею в виду лассо, ребристую регрессию, эластичную сеть и тому подобное.

Рассмотрим прогностическую модель данных здравоохранения, содержащую демографические и диагностические данные, где прогнозируется продолжительность пребывания в стационаре. Для некоторых людей есть несколько наблюдений LOS (то есть, более одного эпизода IP) в течение базового периода времени, которые коррелированы.

Имеет ли смысл, например, строить упругую чистую прогностическую модель, которая содержит термин перехват случайного эффекта для каждого человека?

RobertF
источник
Субтитры для вашей первой строки: «Методами случайных эффектов (то есть предположениями о том, как параметр распределен случайным образом) я имею в виду приоры Лапласа и приоры Норма по параметрам регрессии ... и т. П.» :-)
сопряженный

Ответы:

7

Есть несколько работ, посвященных этому вопросу. Я бы посмотрел в произвольном порядке:

  1. Pen.LME: Говард Д. Бонделл, Арун Кришна и Суджит К. Гхош. Совместный выбор переменных для фиксированных и случайных эффектов в линейных моделях смешанных действий. Biometrics, 66 (4): 1069-1077, 2010.

  2. GLMMLASSO: Юрг Шеллдорфер, Питер Бульманн, Сара ван де Гир. Оценка для многомерных линейных смешанных моделей с использованием L1-штрафования. Скандинавский журнал статистики, 38 (2): 197-214, 2011.

который можно найти в Интернете.

Я заканчиваю работу по применению эластичного чистого штрафа к смешанной модели (LMMEN) сейчас и планирую отправить его для обзора журнала в следующем месяце.

  1. LMMEN: Сиди, Ритов, Унгер. Регуляризация и классификация линейных смешанных моделей через штраф за упругую сеть

В общем, если вы моделируете данные, которые либо являются ненормальными, либо не имеют идентификационной ссылки, я бы пошел с GLMMLASSO, (но учтите, что он не может обрабатывать много RE). В противном случае Pen.LME хорош, учитывая, что у вас нет сильно коррелированных данных, будь то фиксированные или случайные эффекты. В последнем случае вы можете написать мне, и я был бы рад выслать вам код / ​​бумагу (я поставлю его на кран в ближайшем будущем).

Я загрузил в CRAN сегодня - lmmen . Он решает задачу линейной смешанной модели с штрафом типа упругой сети на фиксированные и случайные эффекты одновременно.

В нем также есть функции cv для пакетов lmmlasso и glmmLasso .

yonicd
источник
1
Йоник, применение эластичной сетки к линейным смешанным моделям именно то, что я ищу. Я работаю с генетическими данными, которые коррелируют, поэтому групповой выбор эластичной сети был бы очень полезен. Я пытался связаться с вами, но не нашел другого способа, кроме публикации этого ответа, так как кажется невозможным отправить сообщение. В любом случае, я с нетерпением жду вашей статьи и попробую ваш код, как только он станет доступен.
5

Я всегда рассматривал регрессию гребня как просто эмпирические модели случайных эффектов, не ограниченные одной категориальной переменной (и не представляющие собой причудливые матрицы корреляции). Почти всегда можно получить одни и те же прогнозы из перекрестной проверки штрафа за гребень и подбора / оценки простого случайного эффекта. В вашем примере вы могли бы получить фантазию и получить отдельную оценку штрафа за функции демо / диагонали и еще одну за индикаторы пациента (используя что-то, выравнивающее коэффициент масштабирования штрафа в glmnet). В качестве альтернативы, вы можете добавить необычный случайный эффект, который влияет на человека по времени. Ни одна из этих возможностей не является правильной или неправильной, они просто полезны.

Ши Паркс
источник
2

Я сейчас думаю о подобном вопросе. Я думаю, что в приложении вы можете сделать это, если оно работает, и вы считаете, что это разумно. Если это обычная настройка для случайных эффектов (это означает, что вы провели повторные измерения для каждой группы), то речь идет о технике оценки, которая менее спорна. Если у вас фактически нет многократных повторных измерений для большинства групп, то это может лежать на границе обычной модели случайных эффектов, и вы можете тщательно обосновать ее обоснованность (с точки зрения методологии), если хотите предложить ее в качестве общего метод.

ltx5151
источник