В модели смешанных эффектов рекомендуется использовать фиксированный эффект для оценки параметра, если включены все возможные уровни (например, как мужчины, так и женщины). Кроме того, рекомендуется использовать случайный эффект для учета переменной, если включенные уровни представляют собой просто случайную выборку из популяции (зарегистрированных пациентов из вселенной возможных пациентов) и вы хотите оценить среднее значение и дисперсию популяции вместо средних значений. уровней отдельных факторов.
Мне интересно, если вы логически обязаны всегда использовать фиксированный эффект таким образом. Рассмотрим исследование того, как размер стопы / обуви изменяется в процессе развития и связан, скажем, с ростом, весом и возрастом. Ясно, что необходимо как-то включить в модель, чтобы учесть тот факт, что измерения за эти годы вложены в заданную ногу и не являются независимыми. Более того, справа и слева есть все возможности, которые могут существовать. Кроме того, это может быть очень верно, что для данного участника их правая нога больше (или меньше), чем их левая. Однако, хотя размер ступни у всех людей несколько различается, нет никаких оснований полагать, что правые ступни в среднем будут больше левых. Если они присутствуют в вашей выборке, это, вероятно, связано с генетикой людей в вашей выборке, а не с особенностями правой ноги. Наконец, кажется мешающим параметром, а не то , что вы действительно заботитесь о.
Позвольте мне отметить, что я сделал этот пример. Это может быть не очень хорошо; это просто чтобы донести идею. Насколько я знаю, наличие большой правой ноги и маленькой левой ноги было необходимо для выживания в палеолите.
В таком случае, имеет ли смысл (больше / меньше / меньше) иметь смысл включать в модель как случайный эффект? Каковы были бы плюсы и минусы использования фиксированного и случайного эффекта здесь?
источник
Ответы:
Общая проблема с «фиксированными» и «случайными» эффектами заключается в том, что они не определены согласованным образом. Эндрю Гельман цитирует несколько из них:
и замечает, что они не соответствуют. В своей книге « Анализ данных с использованием регрессионных и многоуровневых / иерархических моделей» он, как правило, избегает использования этих терминов, и в своей работе он фокусируется на фиксированных или изменяющихся перехватах и наклонах групп, поскольку
Это особенно верно для байесовской структуры - обычно используемой для смешанных моделей - где все эффекты случайны сами по себе. Если вы думаете о Байесе, вы на самом деле не озабочены «фиксированными» эффектами и точечными оценками, и у вас нет проблем с обработкой всех эффектов как случайных.
Чем больше я читаю на эту тему, тем больше я убежден, что это скорее идеологическая дискуссия о том, что мы можем (или должны) оценить и что мы можем только предсказать (здесь я мог бы сослаться и на ваш собственный ответ ). Вы используете случайные эффекты, если у вас есть случайная выборка возможных результатов, поэтому вас не интересуют индивидуальные оценки, и вы заботитесь скорее о последствиях для населения, а не отдельных людей. Таким образом, ответ на ваш вопрос зависит также от того, что вы думаете о том, хотите ли вы или можете оценить фиксированные эффекты с учетом ваших данных. Если в ваши данные включены все возможные уровни, вы можетеоцените фиксированные эффекты - также, как и в вашем примере, количество уровней может быть небольшим, что, как правило, не подходит для оценки случайных эффектов, и для этого есть некоторые минимальные требования .
Аргумент в лучшем случае
Скажем, у вас есть неограниченное количество данных и неограниченная вычислительная мощность. В этом случае вы можете представить оценку каждого эффекта как фиксированного, поскольку фиксированные эффекты дают вам большую гибкость (позволяют нам сравнивать отдельные эффекты). Однако даже в этом случае большинство из нас неохотно используют фиксированные эффекты для всего.
Например, представьте, что вы хотите смоделировать результаты экзаменов школ в каком-либо регионе, и у вас есть данные по всем 100 школам в регионе. В этом случае вы могли бы угрожать школам как фиксированным - поскольку у вас есть данные на всех уровнях - но на практике вы, скорее всего, предпочли бы считать их случайными. Это почему?
Одна из причин заключается в том, что, как правило, в подобных случаях вас интересует не влияние отдельных школ (и их трудно сравнивать), а скорее общая разница между школами.
Другой аргумент здесь - модель скупости. Как правило, вас не интересует модель «всевозможного влияния», поэтому в вашей модели вы включаете несколько фиксированных эффектов, которые вы хотите протестировать и контролировать для других возможных источников изменчивости. Это делает модели смешанных эффектов подходящими для общего подхода к статистическому моделированию, где вы оцениваете что-то и контролируете другие вещи. Со сложными (многоуровневыми или иерархическими) данными у вас есть много эффектов для включения, поэтому вы угрожаете некоторым как «фиксированным», а некоторые как «случайным», чтобы контролировать их.
В этом сценарии вы также не будете думать о школах как о том, что каждая из них имеет свое уникальное влияние на результаты, а скорее о школах, имеющих какое-то влияние в целом. Таким образом, этот аргумент состоит в том, что мы считаем, что на самом деле невозможно оценить уникальные эффекты отдельных школ, и поэтому мы угрожаем им как случайной выборкой возможных эффектов школы.
Модели со смешанными эффектами находятся где-то между сценариями «все исправлено» и «все случайно». Данные, с которыми мы сталкиваемся, заставляют нас снизить наши ожидания в отношении оценки всего как фиксированных эффектов, поэтому мы решаем, какие эффекты мы хотим сравнить и какие эффекты мы хотим контролировать, или имеем общее представление об их влиянии. Речь идет не только о том, что это за данные, но и о том, как мы думаем о данных во время их моделирования.
источник
Управляющее резюме
Действительно, часто говорят, что если все возможные уровни факторов включены в смешанную модель, то этот фактор следует рассматривать как фиксированный эффект. Это не обязательно верно для ДВУХ ОТЛИЧНЫХ ПРИЧИН:
(1) Если число уровней велико, то это может иметь смысл рассматривать [пересеченный] фактор как случайные.
Я согласен как с @Tim, так и с @RobertLong: если фактор имеет большое количество уровней, включенных в модель (например, все страны мира; или все школы в стране; или, возможно, все население страны). предметы обследуются и т. д.), тогда нет ничего плохого в том, чтобы рассматривать его как случайный - это может быть более экономным, может дать некоторую усадку и т. д.
(2) Если фактор вложен в другой случайный эффект, то он должен рассматриваться как случайный, независимо от количества уровней.
В этой теме возникла путаница (см. Комментарии), поскольку другие ответы касаются случая № 1 выше, но приведенный вами пример является примером другой ситуации, а именно, этого случая № 2. Здесь есть только два уровня (то есть совсем не «большое количество»!), И они исчерпывают все возможности, но они вложены в другой случайный эффект , дающий вложенный случайный эффект.
Детальное обсуждение вашего примера
Стороны и предметы в вашем воображаемом эксперименте связаны как классы и школы в примере стандартной иерархической модели. Возможно, каждая школа (№ 1, № 2, № 3 и т. Д.) Имеет класс A и класс B, и эти два класса должны быть примерно одинаковыми. Вы не будете моделировать классы A и B как фиксированный эффект с двумя уровнями; это было бы ошибкой. Но вы не будете моделировать классы A и B как «отдельный» (т.е. скрещенный) случайный эффект с двумя уровнями; это тоже было бы ошибкой. Вместо этого вы будете моделировать классы как вложенный случайный эффект внутри школ.
Смотрите здесь: Скрещенные и вложенные случайные эффекты: чем они отличаются и как они правильно указаны в lme4?
Как вы писали сами, «нет никаких оснований полагать, что правые ноги в среднем будут больше левых». Таким образом, не должно быть никакого «глобального» эффекта (ни фиксированного, ни случайного пересечения) правой или левой ноги вообще; вместо этого можно думать, что у каждого субъекта есть «одна» и «другая» ступни, и эту изменчивость мы должны включить в модель. Эти «один» и «другой» ноги вложены в предметы, следовательно, вложенные случайные эффекты.
Более подробная информация в ответ на комментарии. [26 сентября]
Моя модель выше включает Сторону как вложенный случайный эффект в Предметах. Вот альтернативная модель, предложенная @Robert, где Side - фиксированный эффект:
Это не может.
То же самое относится и к гипотетической модели @ gung с использованием Side как скрещенного случайного эффекта:
Он также не учитывает зависимости.
Демонстрация с помощью симуляции [2 октября]
Вот прямая демонстрация в R.
Я генерирую игрушечный набор данных с пятью предметами, измеренными на обеих ногах в течение пяти лет подряд. Влияние возраста линейно. Каждый субъект имеет случайный перехват. И у каждого субъекта одна из ног (левая или правая) больше другой.
Извиняюсь за мои ужасные навыки R. Вот как выглядят данные (каждые пять последовательных точек - это один фут одного человека, измеренный за эти годы; каждые десять последовательных точек - два фута одного и того же человека):
Теперь мы можем разместить несколько моделей:
Все модели включают фиксированный эффект
age
и случайный эффектsubject
, но относятся по-side
разному.side
age
side
age
side
age
Это ясно показывает, что
side
следует рассматривать как вложенный случайный эффект.Наконец, в комментариях @Robert предложил включить глобальный эффект
side
в качестве управляющей переменной. Мы можем сделать это, сохраняя вложенный случайный эффект:side
side
источник
side
встречается какое-либо из обычных определений / рекомендаций, когда фактор следует рассматривать как случайный против фиксированного. В частности, делать выводы за выборочные уровни фактора не имеет смысла. Более того, при наличии только двух уровней этого фактора обработка его как фиксированного представляется однозначным и простым способом приблизиться к моделированию.side
как фиксированный эффект означает допустить, что одна из сторон (например, справа) всегда на определенную величину больше другой (слева). Эта сумма одинакова для всех людей. Это явно не то, что имел в виду ФП. Он писал, что у некоторых людей право может быть больше, а у других - левое. Тем не менее, мы должны учитыватьside
из-за коррелированных ошибок. Почему тогда мы не можем рассматривать как вложенный случайный эффект? Это точно как классы в школах.Чтобы добавить к другим ответам:
Я не думаю, что вы логически обязаны всегда использовать фиксированный эффект, как описано в ОП. Даже когда обычные определения / рекомендации относительно того, когда рассматривать фактор как случайный, не соблюдаются, я мог бы склоняться к тому, чтобы моделировать его как случайный при большом количестве уровней, так что обработка коэффициента как фиксированного потребляла бы много степеней свобода и результат в громоздкой и менее экономной модели.
источник
side
либо как фиксированный, либо как скрещенный случайный эффект обязательно означает, что одна из сторон (например, справа) всегда больше, чем другая (слева), для всех объектов. Это явно не то, что Ганг написал в своем ОП, заявив, что «нет никаких оснований полагать, что правые ноги в среднем будут больше левых». Я до сих пор вижу пример Гунга как ясный случай для вложенного случайного эффекта в полной аналогии с классами в школах.Если вы говорите о ситуации, когда вы знаете все возможные уровни интересующего фактора, а также имеете данные для оценки эффектов, то определенно вам не нужно представлять уровни со случайными эффектами.
Причина, по которой вы хотите установить случайный эффект для фактора, заключается в том, что вы хотите сделать вывод о влиянии всех уровней этого фактора, которые обычно неизвестны. Чтобы сделать такой вывод, вы предполагаете, что эффекты всех уровней в целом образуют нормальное распределение. Но, учитывая ваши проблемы, вы можете оценить влияние всех уровней. Тогда, конечно, нет необходимости устанавливать случайные эффекты и накладывать дополнительные предположения.
Это похоже на ситуацию, когда вы можете получить все значения совокупности (таким образом, вы знаете истинное среднее значение), но вы пытаетесь взять большую выборку из совокупности и использовать центральную предельную теорему для аппроксимации распределения выборки, а затем сделайте вывод о истинном значении.
источник