У меня есть очень большой набор данных, где я повторял измерения в течение определенного времени для отдельных мест. Некоторые местоположения могут иметь 10 точек данных, а некоторые местоположения имеют только 1 точку данных. Я подхожу к смешанной модели и использую локации в качестве случайных эффектов. Мой вопрос заключается в том, могу ли я по-прежнему использовать местоположение, в котором есть только одна точка данных (поскольку вы не можете создать линию регрессии только с 1 данными), или я должен исключить эти местоположения?
mixed-model
multilevel-analysis
любительский
источник
источник
Ответы:
Вы должны держать их в модели. Они не влияют на оценку дисперсии случайного эффекта местоположения, но вы можете использовать их для оценки средней структуры.
В частности, пусть будет дисперсией случайного эффекта местоположения, а - необъяснимой дисперсией. Функция правдоподобия для местоположения только с одним наблюдением не имеет кривизны в пока остается постоянная (то есть две дисперсии не идентифицируются друг от друга, но общая дисперсия идентифицируется). Но есть кривизна в , коэффициенты регрессии.σ21 σ22 σ21 σ21+σ22 β
Надеюсь, это не слишком часто встречается в вашем наборе данных, иначе у вас будет очень неточная оценка случайной дисперсии эффекта.
источник