ANOVA с независимыми наблюдениями

11

Извините за подробный фон этого вопроса:

Время от времени в исследованиях поведения животных экспериментатор интересуется количеством времени, которое субъект проводит в различных, заранее определенных зонах в испытательном аппарате. Я часто видел данные такого рода, проанализированные с использованием ANOVA; однако я никогда не был полностью убежден в достоверности таких анализов, учитывая, что ANOVA предполагает, что наблюдения являются независимыми, и они фактически никогда не являются независимыми в этих анализах (так как больше времени, проведенного в одной зоне, означает, что меньше расходуется в других зонах! ).

Например,

DR Smith, CD Striplin, AM Geller, RB Mailman, J. Drago, CP Lawler, M. Gallagher, Поведенческая оценка мышей, лишенных рецепторов допамина D1A , Neuroscience, том 86, выпуск 1, 21 мая 1998 года, страницы 135-146.

В вышеприведенной статье они уменьшают степени свободы на 1, чтобы компенсировать отсутствие независимости. Тем не менее, я не уверен, как такая манипуляция может фактически улучшить это нарушение допущений ANOVA.

Возможно, процедура хи-квадрат может быть более подходящей? Что бы вы сделали для анализа таких данных (предпочтение для зон, основанное на времени, проведенном в зонах)?

Благодаря!

Майк Вонг
источник

Ответы:

3

(Будьте бдительны: я не эксперт в этой области)

Если вы просто хотите поговорить о различиях во времени, затрачиваемом на местоположение, то отправка данных «время на местоположение» в виде значений в многочленной смешанной модели (см. Пакет MCMCglmm для R) с использованием субъекта в качестве случайного эффекта должна сделать трюк.

Если вы хотите поговорить о различиях в предпочтениях местоположения во времени, то, возможно, время задержки соответствует разумным интервалам (может быть, разрешению вашего устройства синхронизации?), Классифицируйте каждый интервал в соответствии с местоположением мыши в это время (например, если 3 местоположения, каждый интервал помечается как 1, 2 или 3), и снова используется полиномиальная модель смешанных эффектов с субъектом в качестве случайного эффекта, но этот интервал времени добавляется как фиксированный эффект (хотя, возможно, только после интервала факторизации, который снижает мощность, но должен помочь захватить нелинейности во времени).

Майк Лоуренс
источник
5

Майк,

Я согласен, что ANOVA на основе общего времени, вероятно, не является правильным подходом здесь. Кроме того, я не уверен, что Chi Sqaure решит вашу проблему. Хи-квадрат будет учитывать идею о том, что вы не можете находиться в двух местах одновременно, но это не решает проблему наличия вероятных зависимостей между временем N и временем N + 1. Что касается этого второго вопроса, я вижу некоторые аналогии между вашей ситуацией и тем, с чем сталкиваются люди с данными отслеживания глаз и мыши. Полиномиальная модель какого-то рода может хорошо служить вашим целям. К сожалению, детали этого типа модели не в моей компетенции. Я уверен, что в какой-то статистической книге где-то есть хороший небольшой учебник по этой теме, но в голове я бы указал вам на:

  • Барр DJ (2008) Анализ данных отслеживания движений в визуальном мире с использованием многоуровневой логистической регрессии. Журнал памяти и языка, специальный выпуск: анализ новых данных (59), стр. 457-474.
  • https://r-forge.r-project.org/projects/gmpm/ - это непараметрический подход к той же проблеме, который разрабатывает доктор Барр

Во всяком случае, оба этих источника должны быть более чем полными, потому что они разбираются в том, как анализировать временную зависимость позиции.

russellpierce
источник
4

Посмотрите на модели с пространственно коррелированными ошибками (и пространственно коррелированными ковариатами). Краткое введение со ссылками на GeoDa доступно здесь . Есть много текстов; хорошие из них - Ноэль Кресси , Роберт Хейнинг и Фотерингем и др. (последняя ссылка ведет на резюме, а не на сайт книги). Недавно появился R-код, но я не знаком с ним.

Whuber
источник
3

Я собираюсь предложить ответ, который сильно отличается от традиционного ANOVA. Пусть T будет общим временем, которое животное может провести во всех зонах. Вы можете определить T как общее время пробуждения или что-то подобное. Предположим, что у вас есть J зоны. Тогда по определению у вас есть:

Сумма T_j = T

Вы можете нормализовать вышесказанное, разделив lhs и rhs на T, и вы получите

Сумма P_j = 1

где P_j - доля времени, которое животное проводит в зоне j.

Теперь у вас есть вопрос, если P_j значительно отличается от 1 / J для всех j.

Можно предположить, что P_j следует распределению дирихле и оценить две модели.

Нулевая модель

Установите параметры распределения так, чтобы P_j = 1 / J. (Установка параметров распределения на 1 подойдет.)

Альтернативная модель

Установите параметры распределения, чтобы быть функцией конкретных ковариат. Затем вы можете оценить параметры модели.

Вы бы выбрали альтернативную модель, если она превосходит нулевую модель по некоторым критериям (например, отношение правдоподобия).


источник