Проверка гипотез и значение для временных рядов

Обычный критерий значимости при поиске двух групп населения - это t-критерий, если возможно, парный t-критерий. Это предполагает, что распределение нормальное.

Существуют ли похожие упрощающие предположения, которые дают критерий значимости для временного ряда? В частности, у нас есть две довольно маленькие популяции мышей, которых обрабатывают по-разному, и мы измеряем вес раз в неделю. Оба графика отображают плавно растущие функции, причем один график явно выше другого. Как мы можем количественно определить «определенность» в этом контексте?

Нулевая гипотеза должна заключаться в том, что веса двух групп населения "ведут себя одинаково" с течением времени. Как можно сформулировать это в терминах простой модели, которая довольно распространена (как обычные распределения) только с небольшим количеством параметров? Как только вы это сделаете, как можно измерить значимость или что-то аналогичное p-значениям? Как насчет спаривания мышей, соответствующих как можно большему количеству характеристик, с каждой парой, имеющей одного представителя от каждой из двух популяций?

Я бы приветствовал указатель на какую-нибудь соответствующую хорошо написанную и понятную книгу или статью о временных рядах. Я начинаю как неуч. Спасибо за вашу помощь.

Дэвид Эпштейн

time-series hypothesis-testing statistical-significance Дэвид Эпштейн
источник

Возможно, вы захотите разыграть более широкую сеть, потому что это не обязательно вопрос временного ряда. Действительно, возможно, самый фундаментальный вопрос здесь касается наилучшего или, по крайней мере, правильного способа количественной оценки «конечной точки» лечения: означает ли это рост популяции через определенное время, средние темпы роста со временем и т. Д.? Если вы не знали об этом до начала эксперимента и вдруг заметили постоянные различия в кривых роста, то вы работаете в исследовательском режиме, а не в подтверждающем, и p-значения для проверки гипотез будут обманчиво хорошими.

whuber

Результат качественный, как и ожидалось, и односторонний тест представляется целесообразным. Причина, по которой я спросил о временных рядах, заключается в том, что если кто-то измеряет только конечный вес (который является наиболее релевантным измерением), то он отбрасывает всю информацию из более ранних временных точек, и это кажется неправильным.

Дэвид Эпштейн

Вы правы: вы не хотите выбрасывать эти данные. Но методы временных рядов выходят на первый план для моделей данных, где временные корреляции отклонений от идеализированных кривых важны либо для их собственных интересов, либо потому, что они могут помешать хорошей оценке. Ваша ситуация вряд ли попадет ни в один из этих случаев. Более простые, более научно значимые методы доступны.

whuber

@ whuber, не является ли вес с течением времени контрольной группы мышей «идеализированной кривой» в некотором смысле? Или, по крайней мере, теоретическая модель соответствует этим данным?

naught101

Да, @naught, это разумный способ взглянуть на это. Но «кривая» - это не то же самое, что «временной ряд». Например, линейная регрессия может (и часто рассматривается) как подгонка кривых к данным, но она отделена от анализа временных рядов, который подчеркивает структуру корреляций между отклонениями между данными и идеализированной кривой.

whuber

Ответы:

Есть много способов сделать это, если вы думаете о колебаниях веса как о динамическом процессе.

Например, его можно смоделировать как интегратор $\dot x(t) = \theta x(t) + v(t)$

где - изменение веса, относится к тому, насколько быстро изменяется вес, а - стохастическое нарушение, которое может повлиять на изменение веса. Вы можете смоделировать как для известного (вы также можете оценить его). $x(t)$ $\theta$ $v(t)$ $v(t)$ $\mathcal N(0,Q)$ $Q$

Отсюда вы можете попытаться определить параметр для двух популяций (и их ковариацию), используя, например, метод ошибки прогнозирования. Если предположение Гаусса выполнено, методы ошибки прогнозирования дадут, что оценка также является гауссовой (асимптотически), и поэтому вы можете построить проверку гипотезы, чтобы определить, является ли оценка статистически близкой к . $\theta$ $\theta$ $\theta_1$ $\theta_2$

Для справки могу предложить эту книгу .

andrecb
источник

Я бы предложил определить модель ARIMA для каждой мыши отдельно, а затем проанализировать их на предмет сходства и обобщения. Например, если у первых мышей есть AR (1), а у вторых - AR (2), наиболее общей (самой большой) моделью будет AR (2). Оцените эту модель глобально, то есть для комбинированных временных рядов. Сравните сумму ошибок квадратов для объединенного набора с суммой двух отдельных ошибок квадратов ошибок, чтобы сгенерировать значение F для проверки гипотезы постоянных параметров по группам. Если вы хотите опубликовать свои данные, я проиллюстрирую этот тест точно.

ДОПОЛНИТЕЛЬНЫЕ КОММЕНТАРИИ:

Поскольку набор данных автоматически коррелируется, нормальность не применяется. Если наблюдения независимы во времени, то можно применить некоторые из известных методов не временных рядов. С точки зрения вашей просьбы о легкой для чтения книге о временных рядах, я предлагаю текст Вэй от Addison-Wesley. Социологи найдут нематематический подход Mcleary and Hay (1980) более интуитивным, но лишенным строгости.

IrishStat
источник

Это действительно не похоже на решение фундаментальных проблем. (1) Почему такая модель подходит? (2) Почему следует моделировать каждую мышь, а не, скажем, средний вес популяции или прирост веса? (3) Почему важна проверка постоянных параметров? Вопрос напрашивается на односторонний тест. Большинство упомянутых вами параметров не имеют научной значимости и не дают прямого количественного определения того, что один график постоянно находится над другим. (4) Как вы контролируете возможные различия в характеристиках двух популяций в начале эксперимента?

whuber

: whuber. Тест на постоянство параметров важен, потому что у вас есть набор коэффициентов для первой группы прочитанных форм, например, 1 и второй набор коэффициентов для второй мыши. Вопрос заключается в том, «есть ли в общем значимая разница между коэффициентами». Теперь продолжаем с вашим комментарием, поскольку один из коэффициентов модели может быть константой, и если это так, то разница между коэффициентами может быть связана с тем, что константы статистически отличаются друг от друга. Отметим, что базовая модель ARIMA может не обязательно иметь константу, поскольку это может быть модель разности.

IrishStat

Я думаю, что вы отчасти правы, но вам нужно уточнить вашу характеристику проблемы. Многие из коэффициентов ARIMA могут быть научно неактуальными. Например, если один из них ведет себя как квадратичный термин во времени, разница может что-то сказать о форме кривых роста, но это может оказаться бесполезным. Если выбрать коэффициенты, отражающие экспериментальную конечную точку (точки), и протестировать только их, тем самым можно достичь некоторого успеха. В целом, однако, модели временных рядов вводят коэффициенты (например, автокорреляцию), которые вряд ли будут представлять здесь прямой научный интерес.

whuber

whuber: «Если кто-то выбирает коэффициенты для отражения экспериментальной конечной точки (точек) и проверяет только их, тем самым может быть достигнут некоторый результат», для меня не имеет большого смысла, так как он игнорирует промежуточные точки. В отличие от вашего комментария, режим временных рядов и сопутствующие ему коэффициенты представляют значительный научный интерес, поскольку он характеризует распределение показаний и преобразует их в случайный процесс (термин ошибки), который не имеет автокорреляционной структуры и затем поддается тестированию. требует нормальности. Тест, который я предлагаю, требует выполнения этого предположения.

IrishStat

Автокорреляция здесь может иметь мало значения. Интерес явно фокусируется на тенденциях: как основные кривые роста имеют тенденцию различаться между двумя популяциями? Параметры автокорреляции являются неприятными параметрами, которые должны вводиться и рассматриваться только в той степени, в которой они могут помочь улучшить оценку этих кривых роста. Первым приоритетом является принятие научной модели роста, представление этой модели с параметрами, которые можно интерпретировать и представляют интерес, и их оценка . Автоматическое применение методов временных рядов вряд ли достигнет этого.

whuber