Я использую обобщенную линейную модель в SPSS, чтобы посмотреть на различия в среднем количестве гусениц (ненормальное, используя распределение Твиди) на 16 различных видах растений.
Я хочу провести несколько сравнений, но я не уверен, стоит ли мне использовать коррекционный тест Сидака или Бонферрони. В чем разница между двумя тестами? Один лучше другого?
Ответы:
Если вы запустите независимых статистических тестов, используя α в качестве уровня значимости, и в каждом случае получите нулевое значение, обнаружите ли вы «значимость» или нет, это просто случайная переменная. В частности, оно взято из биномиального распределения с p = α и n = k . Например, если вы планируете запустить 3 теста с использованием α = 0,05 , и (без вашего ведома) разницы фактически нет в каждом случае, то есть шанс 5% на получение значимого результата в каждом тесте. Таким образом, коэффициент ошибок типа I поддерживается на уровне αК α р = а п = к α = 0,05 α для тестов по отдельности, но в наборе из 3 тестов частота ошибок долгосрочного типа I будет выше. Если вы считаете, что имеет смысл сгруппировать / подумать об этих 3 тестах вместе, то вам может потребоваться сохранить коэффициент ошибок типа I на уровне для набора в целом , а не только по отдельности. Как вы должны идти об этом? Существуют два подхода, которые сосредотачиваются на переходе от исходного α (т.е. α o ) к новому значению (т.е. α n e w ):α α αо αn e w
Bonferroni: скорректируйте используемый для оценки «значимости», таким образом, чтобыα
Данн-Сидак: отрегулируйте используяα
(Обратите внимание, что Данн-Сидак предполагает, что все тесты в наборе независимы друг от друга и могут привести к инфляции ошибок семейного типа I, если это предположение не выполняется.)
Важно отметить , что при проведении испытаний, существует два вида ошибок , которые вы хотите избежать, типа I (то есть, говоря , что есть разница , когда есть не один) и типа II (то есть, говоря , что не разница, когда есть на самом деле). Как правило, когда люди обсуждают эту тему, они только обсуждают - и, кажется, знают только о проблемах I типа. Кроме того, люди часто пренебрегают упоминанием о том, что рассчитанная частота ошибок будет сохраняться только в том случае, если все нулевые значения истинны. Совершенно очевидно, что вы не можете сделать ошибку типа I, если нулевая гипотеза неверна, но важно учитывать этот факт при обсуждении этой проблемы.
источник
Если вам нужна еще более мощная процедура, вы можете использовать процедуру Бонферрони-Холма.
источник
Поправка Сидака предполагает, что отдельные тесты статистически независимы. Поправка Бонферрони не предполагает этого.
источник
Сидак и Бонферрони настолько похожи, что вы, вероятно, получите один и тот же результат независимо от того, какую процедуру вы используете. Бонферрони лишь немного более консервативен, чем Сидак. Например, для двух сравнений и семейной альфа-коэффициента 0,05, Сидак будет проводить каждый тест в 0,0253, а Бонферрони будет проводить каждый тест в 0,0250.
Многие комментаторы на этом сайте говорят, что Sidak действителен только тогда, когда статистика тестов ваших сравнений независима. Это не правда. Sidak допускает небольшую инфляцию частоты семейных ошибок, когда статистика теста ОТРИЦАТЕЛЬНО зависит, но если вы делаете двусторонние тесты, отрицательная зависимость, как правило, не является проблемой. При неотрицательной зависимости, Sidak фактически обеспечивает верхнюю границу для семейной частоты ошибок. Тем не менее, существуют другие процедуры, которые обеспечивают такую границу и имеют тенденцию сохранять большую статистическую мощность, чем Sidak. Так что Сидак, вероятно, не лучший выбор.
Одна вещь, которую обеспечивает процедура Бонферрони (чего не делает Sidak), - это строгий контроль ожидаемого количества ошибок типа I - так называемая «частота ошибок для каждой семьи», которая является более консервативной, чем частота ошибок для всей семьи. Для получения дополнительной информации см .: Frane, AV (2015) «Являются ли коэффициенты ошибок по типу I на семью релевантными в социальной и поведенческой науке?» Журнал современных прикладных статистических методов 14 (1), 12-23.
источник