У меня есть данные о численности различных рыб, взятых за период около 5 лет, но в очень нерегулярном порядке. Иногда между образцами существуют месяцы, иногда за один месяц. Есть также много 0 отсчетов
Как бороться с такими данными?
Я могу представить это достаточно легко в R, но графики не особенно освещают, потому что они очень ухабистые.
С точки зрения моделирования - с видами, моделируемыми в зависимости от различных вещей, - может быть, смешанная модель (многоуровневая модель).
Любые ссылки или идеи приветствуются
Некоторые подробности в ответ на комментарии
Есть около 15 видов.
Я пытаюсь получить представление о тенденциях или сезонности в каждой рыбе и посмотреть, как виды связаны друг с другом (мой клиент изначально хотел простую таблицу корреляций)
Цель описательная и аналитическая, а не прогнозирующая
Дальнейшие изменения: я нашел эту статью K. Rehfield et al., В которой предлагается использовать ядра Гаусса для оценки ACF для сильно нерегулярных временных рядов
http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf
Ответы:
Я потратил довольно много времени на создание общей структуры для неравномерно распределенных временных рядов: http://www.eckner.com/research.html
Кроме того, я написал статью об оценке тренда и сезонности для неравномерно распределенных временных рядов.
Я надеюсь, что вы найдете результаты полезными!
источник
Я не знаю, подходит ли смешанная модель (используя стандартные пакеты, в которых структура случайного эффекта является линейным предиктором), если только вы не думаете, что данные во все моменты времени должны быть в некотором смысле взаимозаменяемыми (в этом случае нерегулярные интервалы не являются проблемой) - на самом деле это не было бы разумным способом моделировать временную автокорреляцию. Возможно, вы могли бы обманом заставить lmer () сделать что-то вроде автоагрессии, но то, как именно вы это сделаете, ускользает от меня прямо сейчас (возможно, я не думаю об этом прямо). Кроме того, я не уверен, какой была бы «переменная группировки», которая вызывает автокорреляцию в сценарии смешанной модели.
Если временная автокорреляция является неприятным параметром, и вы не ожидаете, что она будет слишкомбольшие, то вы можете объединить данные в эпохи, которые по существу не пересекаются друг с другом с точки зрения корреляции (например, отделить временные ряды в точках, где нет месяцев) и рассматривать их как независимые копии. Затем вы можете сделать что-то вроде GEE для этого модифицированного набора данных, где «кластер» определяется тем, в какую эпоху вы находитесь, а записи рабочей корреляционной матрицы являются функцией того, насколько далеко друг от друга были сделаны наблюдения. Если ваша регрессионная функция верна, вы все равно получите согласованные оценки коэффициентов регрессии, даже если структура корреляции не указана. Это также позволит вам смоделировать его как данные подсчета, используя, например, лог-линк (как это обычно делается при регрессии Пуассона). Вы также можете построить некоторую дифференциальную корреляцию между видами, где каждая временная точка рассматривается как многовариантный вектор видов с некоторой временной затухающей ассоциацией между временными точками. Это потребует некоторой предварительной обработки, чтобы обманным путем заставить стандартные пакеты GEE сделать это.
Если временная автокорреляция не является неприятным параметром, я бы попробовал нечто более похожее на модель структурированной ковариации, где вы рассматриваете весь набор данных как одно наблюдение большого многомерного вектора, так что ковариация между наблюдениямиYs, YT по видам у , v является
гдее некоторая параметрическая функция, известная с точностью до конечного числа параметров, θ наряду с рядом параметров, управляющих средней структурой. Возможно, вам придется «построить свою собственную» для такой модели, но я также не удивлюсь, если есть пакеты MPLUS, которые делают подобные вещи для данных подсчета.
источник
surveillance
Пакет может иметь функциональные возможности желательно. Этот вид моделирования не является редкостью в экологических исследованиях, поэтому, вероятно, лучше всего найти хороший пакет в экологических уголках CRAN.