Контекст :
Представьте, что у вас было продольное исследование, в котором измеряли зависимую переменную (DV) один раз в неделю в течение 20 недель на 200 участниках. Хотя в целом я интересуюсь, типичные DV, о которых я думаю, включают в себя выполнение работы после найма или различные меры по улучшению благосостояния после вмешательства клинической психологии.
Я знаю, что многоуровневое моделирование может использоваться для моделирования отношений между временем и DV. Вы также можете позволить коэффициентам (например, перехватам, уклонам и т. Д.) Варьироваться между людьми и оценивать конкретные значения для участников. Но что, если при визуальной проверке данных вы обнаружите, что взаимосвязь между временем и DV является одной из следующих:
- отличается по функциональной форме (возможно, некоторые являются линейными, а другие экспоненциальными или имеют разрыв)
- отличается по дисперсии ошибок (некоторые люди более изменчивы от одного момента времени к другому)
Вопросы :
- Что было бы хорошим способом приблизиться к таким данным моделирования?
- В частности, какие подходы хороши для выявления различных типов отношений и классификации людей в зависимости от их типа?
- Какие реализации существуют в R для таких анализов?
- Есть ли ссылки на то, как это сделать: учебник или реальное приложение?
источник
Я бы порекомендовал взглянуть на пару работ Хэпинга Чжана, использующих адаптивные сплайны для моделирования продольных данных:
Кроме того, см. Страницу MASAL для программного обеспечения, включая пакет R.
источник
Это выглядит как модели роста могут иметь потенциал, чтобы вы могли исследовать вашу дисперсию ошибок. ( PDF здесь). (Я не уверен, что такое мультипликативные гетероскедастические модели, но я обязательно должен их проверить).
Модели траектории на основе латентных групп стали очень популярными в последнее время в криминологии. Но многие люди просто считают само собой разумеющимся, что группы действительно существуют, а некоторые проницательные исследования указывают, что вы найдете группы даже в случайных данных. Также следует отметить, что подход к моделированию на основе групп, используемый Нагином, не позволяет вам оценить свою ошибку (и, честно говоря, я никогда не видел модели, которая выглядела бы как разрыв).
Хотя это будет трудно с 20 временными точками, для исследовательских целей может быть полезно создание простой эвристики для идентификации закономерностей (например, всегда низкий или всегда высокий коэффициент вариации). Я представляю себе спарклайны в виде электронных таблиц или параллельных координатных графиков, но я сомневаюсь, что они были бы полезны (я, честно говоря, никогда не видел параллельного координатного графика, который бы очень полезен).
Удачи
источник
Через четыре года после того, как я задал этот вопрос, я узнал несколько вещей, поэтому, возможно, мне стоит добавить несколько идей.
Я думаю, что байесовское иерархическое моделирование обеспечивает гибкий подход к этой проблеме.
Software: Tools like jags, stan, WinBugs, and so on potentially combined with their respective R interface packages (e.g., rjags, rstan) make it easier to specify such models.
Varying within person error: Bayesian models make it easy to specify the within person error variance as a random factor that varies between people.
For example, you could model scoresy on participants i=1,...,n at time points j=1,...J as
Thus the standard deviation of each person might be modelled as a gamma distribution. I have found this to be an important parameter in many psychological domains where people vary in how much they vary over time.
Latent classes of curves: I have not explored this idea as much yet, but it is relatively straight forward to specify two or more possible data generating functions for each individual and then let the Bayesian model choose the most likely model for a given individual. Thus, you would typically get posterior probabilities for each individual regarding which functional form describes the individuals data.
As a sketch of an idea for a model, you could have something like the following:
Wherexij is time and λ(1)ij represents expected values for a three parameter exponential model and λ(2)ij represents expected values for a quadratic model. πi represents the probability that model will choose λ(1)ij .
источник
John Fox has a great appendix available on-line using nlme to look at longitudinal data. It may be useful for you:
http://cran.r-project.org/doc/contrib/Fox-Companion/appendix-mixed-models.pdf
There's a lot of great stuff there (and Fox' books are generally quite good!).
источник