Обычный критерий значимости при поиске двух групп населения - это t-критерий, если возможно, парный t-критерий. Это предполагает, что распределение нормальное.
Существуют ли похожие упрощающие предположения, которые дают критерий значимости для временного ряда? В частности, у нас есть две довольно маленькие популяции мышей, которых обрабатывают по-разному, и мы измеряем вес раз в неделю. Оба графика отображают плавно растущие функции, причем один график явно выше другого. Как мы можем количественно определить «определенность» в этом контексте?
Нулевая гипотеза должна заключаться в том, что веса двух групп населения "ведут себя одинаково" с течением времени. Как можно сформулировать это в терминах простой модели, которая довольно распространена (как обычные распределения) только с небольшим количеством параметров? Как только вы это сделаете, как можно измерить значимость или что-то аналогичное p-значениям? Как насчет спаривания мышей, соответствующих как можно большему количеству характеристик, с каждой парой, имеющей одного представителя от каждой из двух популяций?
Я бы приветствовал указатель на какую-нибудь соответствующую хорошо написанную и понятную книгу или статью о временных рядах. Я начинаю как неуч. Спасибо за вашу помощь.
Дэвид Эпштейн
источник
Ответы:
Есть много способов сделать это, если вы думаете о колебаниях веса как о динамическом процессе.
Например, его можно смоделировать как интеграторИкс˙( t ) = θ x ( t ) + v ( t )
где - изменение веса, относится к тому, насколько быстро изменяется вес, а - стохастическое нарушение, которое может повлиять на изменение веса. Вы можете смоделировать как для известного (вы также можете оценить его).х ( т ) θ V ( T ) V ( T ) N( 0 , Q ) Q
Отсюда вы можете попытаться определить параметр для двух популяций (и их ковариацию), используя, например, метод ошибки прогнозирования. Если предположение Гаусса выполнено, методы ошибки прогнозирования дадут, что оценка также является гауссовой (асимптотически), и поэтому вы можете построить проверку гипотезы, чтобы определить, является ли оценка статистически близкой к .θ θ θ1 θ2
Для справки могу предложить эту книгу .
источник
Я бы предложил определить модель ARIMA для каждой мыши отдельно, а затем проанализировать их на предмет сходства и обобщения. Например, если у первых мышей есть AR (1), а у вторых - AR (2), наиболее общей (самой большой) моделью будет AR (2). Оцените эту модель глобально, то есть для комбинированных временных рядов. Сравните сумму ошибок квадратов для объединенного набора с суммой двух отдельных ошибок квадратов ошибок, чтобы сгенерировать значение F для проверки гипотезы постоянных параметров по группам. Если вы хотите опубликовать свои данные, я проиллюстрирую этот тест точно.
ДОПОЛНИТЕЛЬНЫЕ КОММЕНТАРИИ:
Поскольку набор данных автоматически коррелируется, нормальность не применяется. Если наблюдения независимы во времени, то можно применить некоторые из известных методов не временных рядов. С точки зрения вашей просьбы о легкой для чтения книге о временных рядах, я предлагаю текст Вэй от Addison-Wesley. Социологи найдут нематематический подход Mcleary and Hay (1980) более интуитивным, но лишенным строгости.
источник