В настоящее время я работаю над серией моделей временных рядов Пуассона, пытаясь оценить влияние изменения в том, как были получены подсчеты (переключение с одного диагностического теста на другой), в то же время контролируя другие тренды во времени (скажем, общее увеличение заболеваемость). У меня есть данные для разных сайтов.
Хотя я также работал с GAM, я установил ряд довольно простых GLM с временными тенденциями в них, а затем объединил результаты. Код для этого будет выглядеть примерно так в SAS:
PROC GENMOD data=work.data descending;
model counts = dependent_variable time time*time / link=log dist = poisson;
run;
или это в R:
glm(counts ~ dependent_variable + time + time*time, family="poisson")
Затем беру эти оценки и объединяю их по различным сайтам. Предполагается также, что я пытаюсь использовать смешанную модель Пуассона со случайным наклоном и перехватом для каждого участка, а не объединять. Так что, по сути, у вас будет фиксированный эффект variable_variable, а затем случайный эффект для перехвата и времени (или, в идеале, времени и времени ^ 2, хотя я понимаю, что это немного затруднительно).
Моя проблема в том, что я понятия не имею, как подойти к одной из этих моделей, и кажется, что смешанные модели, где документация для всех, вдруг оказывается очень непрозрачной. У кого-нибудь есть простое объяснение (или код) о том, как соответствовать тому, что я ищу, и на что обратить внимание?
g <- lmer(y ~ x + (1+t+I(t^2)|ID), family="poisson")
) увеличило время вычислений с примерно 0,75 до примерно 11 секунд. По мере роста объема выборки увеличение времени вычислений, вероятно, также увеличивается.В САС:
Но, конечно, есть множество вариантов, более или менее полезных, с которыми можно поиграть.
источник