Я разработал пакет ez для R как средство, помогающее людям переходить от пакетов статистики, таких как SPSS к R. Это (надеюсь) достигается путем упрощения спецификации различных разновидностей ANOVA и обеспечения вывода, подобного SPSS (включая размеры эффектов и допущения). тесты), среди других функций. ezANOVA()
Функция главным образом служит в качестве обертки к car::Anova()
, но текущая версия ezANOVA()
реализует только типа II суммы квадратов, тогда как car::Anova()
разрешения спецификации либо типа II или -III суммы квадратов. Как и следовало ожидать, несколько пользователей попросили меня предоставить аргумент вezANOVA()
это позволяет пользователю запрашивать тип II или тип III. Я не хотел этого делать и изложил свои аргументы ниже, но я был бы признателен за вклад сообщества в мои или любые другие рассуждения, касающиеся этой проблемы.
Причины не включать аргумент "SS_type" в ezANOVA()
:
- Разница между квадратами сумм типов I, II и III возникает только тогда, когда данные не сбалансированы, и в этом случае я бы сказал, что больше пользы от улучшения дисбаланса путем дальнейшего сбора данных, чем с вычислениями ANOVA.
- Различие между типами II и III применяется к эффектам более низкого порядка, которые квалифицируются по эффектам более высокого порядка, и в этом случае я считаю эффекты более низкого порядка с научной точки зрения неинтересными. (Но см. Ниже для возможного усложнения аргумента)
- Для тех редких обстоятельств, когда (1) и (2) не применяются (когда дальнейший сбор данных невозможен, и исследователь имеет действительный научный интерес к квалифицированному основному эффекту, который я не могу себе представить в настоящее время), можно относительно легко изменить
ezANOVA()
источник или нанимаютcar::Anova()
себя для достижения типа III испытаний. Таким образом, я вижу дополнительные усилия / понимание, необходимые для получения тестов типа III, как средство, с помощью которого я могу гарантировать, что только те, кто действительно знает, что они делают, идут по этому пути.
Теперь самый последний запросчик типа III указал, что аргумент (2) подрывается рассмотрением обстоятельств, когда существующие, но «несущественные» эффекты более высокого порядка могут смещать вычисление сумм квадратов для эффектов более низкого порядка. В таких случаях можно себе представить, что исследователь будет обращать внимание на эффект более высокого порядка, и, видя, что он «несущественный», обратится к попытке интерпретации эффектов более низкого порядка, которые, без ведома исследователя, были скомпрометированы. Моя первоначальная реакция заключается в том, что это не проблема с суммами квадратов, а с p-значениями и традицией проверки нулевых гипотез. Я подозреваю, что более явная мера доказательств, такая как отношение правдоподобия, может с большей вероятностью дать менее двусмысленную картину поддерживаемых моделей в соответствии с данными. Тем не менее, я не
источник
Ответы:
Просто для усиления - я самый последний запросчик, я считаю.
В конкретном комментарии по пунктам Майка:
Совершенно очевидно, что различие I / II / III применимо только к коррелированным предикторам (из которых несбалансированные схемы являются наиболее распространенным примером, безусловно, для факторного ANOVA) - но мне кажется, что это аргумент, который отклоняет анализ несбалансированной ситуации (и, следовательно, любые дебаты типа I / II / III). Это может быть несовершенным, но именно так все и происходит (и во многих случаях затраты на дальнейший сбор данных перевешивают статистическую проблему, несмотря на предостережения).
Это совершенно справедливо и отражает суть большинства аргументов «II против III, одобряя II», с которыми я сталкивался. Лучшее резюме, с которым я столкнулся, это Langsrud (2003) «ANOVA для несбалансированных данных: используйте суммы квадратов типа III вместо сумм типа III», Статистика и вычисления 13: 163-167 (у меня есть PDF, если оригинал трудно найти ). Он утверждает (беря двухфакторный случай в качестве основного примера), что если есть взаимодействие, есть взаимодействие, поэтому рассмотрение основных эффектов обычно бессмысленно (очевидно, что это справедливо) - и если нет взаимодействия, анализ типа II Основные эффекты более мощные, чем Тип III (несомненно), поэтому вы всегда должны использовать Тип II. Я видел другие аргументы (например, Venables,
И я согласен с этим: если у вас есть взаимодействие, но у вас есть вопрос о главном эффекте, то вы, вероятно, на самостоятельной территории.
Очевидно, что есть те, кто просто хочет Тип III, потому что это делает SPSS, или какая-то другая ссылка на Высший орган статистики. Я не совсем против этой точки зрения, если речь идет о выборе большого количества людей, придерживающихся SPSS (против чего у меня есть некоторые вещи, а именно, времени, денег и условий истечения лицензии) и типа III SS, или большого количества люди переходят на R и тип III СС. Тем не менее, этот аргумент является явно неудачным статистически.
Тем не менее, аргумент, который я нашел более существенным в пользу типа III, заключается в том, что он был независимо представлен Myers & Well (2003 г., «Дизайн исследования и статистический анализ», стр. 323, 626-629) и Maxwell & Delaney (2004 г.). Проектирование экспериментов и анализ данных: перспектива сравнения моделей », с. 324-328, 332-335). Это следующим образом:
Итак, моя интерпретация (и я не эксперт!) Заключается в том, что по обеим сторонам аргумента есть много Высших Статистических Органов; что выдвигаемые обычные аргументы не относятся к обычной ситуации, которая может вызвать проблемы (эта ситуация является общей для интерпретации основных эффектов при незначительном взаимодействии); и что есть веские причины для беспокойства в связи с подходом типа II в этой ситуации (и все сводится к проблеме власти и потенциального чрезмерного либерализма).
Для меня этого достаточно, чтобы пожелать использовать опцию Type III в ezANOVA, а также Type II, потому что (за мои деньги) это превосходный интерфейс для систем ANOVA от R. На мой взгляд, R - это не простой способ для новичков, а пакет «ez» с ezANOVA и довольно приятными функциями построения графиков делает долгий путь к тому, чтобы сделать R доступным для более широкой исследовательской аудитории. Некоторые из моих мыслей в процессе (и неприятный взлом для ezANOVA) находятся на http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Было бы интересно услышать все мысли!
источник
Предостережение: чисто нестатистический ответ. Я предпочитаю работать с одной функцией (или хотя бы с одним пакетом) при выполнении одного и того же типа анализа (например, ANOVA). До сих пор я последовательно использую,
Anova()
так как предпочитаю использовать его синтаксис для определения моделей с повторяющимися измерениями - по сравнению с нимиaov()
и теряю немного (SS type I) с повторяющимися измерениями.ezANOVA()
хорошо для дополнительной выгоды от размеров эффекта. Но что мне не особенно нравится, так это то, что мне приходится иметь дело с 3 разными функциями, чтобы выполнять по сути один и тот же тип анализа, просто потому, что одна из них реализует функцию X (но не Y), а другая Y (но не X).Для ANOVA, я могу выбрать между
oneway()
,lm()
,aov()
,Anova()
,ezANOVA()
, и , возможно , другие. При обучении R уже трудно объяснять различные варианты, как они связаны друг с другом (aov()
является оберткойlm()
), и какая функция делает что:oneway()
только для однофакторных конструкций, но с опциейvar.equal=FALSE
. Нет такой возможности вaov()
других и других, но эти функции также для многофакторных проектов.aov()
, лучше вAnova()
aov()
, а не вAnova()
Anova()
, а не вaov()
ezANOVA()
, а не в другихБыло бы неплохо научить только одной функции с одним последовательным синтаксисом, который делает все это. Без удобного SS тип III,
ezANOVA()
для меня не может быть такой функции, потому что я знаю, что студентов попросят использовать их в какой-то момент («просто перепроверьте эти результаты, которые получил Джон Доу с помощью SPSS»). Я чувствую, что лучше иметь возможность сделать выбор самостоятельно, не изучая еще один синтаксис для определения моделей. Отношение «я знаю, что лучше для вас» может иметь свои достоинства, но может быть чрезмерно защитным.источник
multcomp
пакет (который, насколько я помню, требуетaov
объектов). В противном случае, я согласен полностью и обычно использоватьez
для моей ежедневной обязанности, потому что это так легко ...aov
элемент, который был бы великолепен. Пока мне обычно лень создавать свой собственныйaov
элемент и использовать тебяezANOVA
вместо этого с t.tests ...ez
Пакет имеет некоторый большой потенциал: в психологии, это уже было рекомендовано довольно часто (ср немецкой книги «R für Einsteiger» по Лумана). Конечно, мы будем признательны за то, чтобы сделать его еще более гибким.R-мир не очень любит Type 3 SS.
Одна из обычно цитируемых ссылок - «Exegeses on Linear Models» Билла Венейблса (2000) .
Я надеюсь, что не осуждаю его, но я думаю, что его главный аргумент в том, что Тип 3 SS нарушает принцип маржинальности линейных моделей и поэтому не является разумным.
источник
Для меня это была открывающая дискуссия по вопросу типа II / III. Спасибо всем за усилия по обеспечению обсуждения. Я бы пришел к выводу о необходимости последовательно продвигать II тип по сравнению с III типом, но имел слабое понимание аргумента - я просто полагался на совет из регрессионной книги Джона Фокса (автомобиль), согласно которому тесты III типа редко даются. интерпретируемый (ну, я думаю, что он сказал, что ...).
В любом случае eZANOVA действительно полезен для разрешения доступа к функциональности R, которая в противном случае была бы невозможна для студентов, которых я преподаю в области психологии. Я предоставляю онлайн-модули R, один из которых содержит ezANOVA для демонстрации смешанного дизайна ANOVA (хотя кажется, что предварительная версия 3 могла содержать ошибки ... дох!)
Попробуйте это здесь:
http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp
после загрузки модуля (~ 10 с) найдите кнопку вычисления (наполовину вниз по странице), и он запустит ezANOVA и связанные таблицы и графики.
Ян
источник