Какие описательные статистические данные не являются величинами эффекта?

12

Википедия говорит

величина эффекта - это мера силы явления или оценка этой величины на основе выборки. Величина эффекта, рассчитанная на основе данных, представляет собой описательную статистику, которая передает оценочную величину отношения, не делая никаких заявлений о том, отражает ли кажущаяся связь в данных истинную связь в популяции.

Чтобы лучше это понять, мне было интересно, что описательная статистика не имеет размера эффекта, кроме графиков и графиков.

Тим
источник
Графики и графики на самом деле могут быть полезны для измерения размера эффекта более интуитивно понятным способом, чем измерение размера эффекта. Если вы на самом деле видите совпадение между двумя группами по некоторым показателям (что примерно соответствует меньшему значению d ), возможно, легче понять, что значительная разница не означает, что у члена одной группы все баллы ниже, чем у членов другой группы. и т. д.
гала-концерт

Ответы:

18

Размеры эффекта

  • Общие стандартизированные величины эффекта обычно определяют количество или степень отношения или эффекта. Наиболее распространенными показателями величины эффекта являются, вероятно, d Коэна, r Пирсона и отношение шансов (особенно для двоичного предиктора).
  • Менее распространенные меры размера эффекта:Тем не менее, вы можете иметь стандартизированные и нестандартные меры размера эффекта. Любая статистика, которая отображает степень взаимосвязи и не особенно зависит от размера выборки, вероятно, является мерой размера эффекта. Таким образом, коэффициенты бета, R-квадрат, ковариация, сырые средние различия между группами и т. Д. Отражают степень эффекта. Тем не менее, я считаю, что некоторые исследователи применяют меры величины эффекта несколько слепо и забывают, что более широкой целью является дать читателям ощущение степени эффекта. И поэтому они часто не осознают, что такие показатели, как средние различия или необработанные коэффициенты регрессии, в некотором смысле являются мерой величины эффекта. Другой пример слепого использования размеров эффекта включает использование мер размера эффекта, которые не имеют интуитивной интерпретации, но были рекомендованы в некоторых учебниках.

Не влияют размеры:

  • Большинство тестовых статистик не являются величинами эффекта. Например, критерий хи-квадрат, t-критерий, z-критерий, F-критерий. Они увеличиваются как при увеличении размера популяции, так и при увеличении размера выборки. Во многих отношениях в последние годы подчеркивался весь язык размеров эффектов, поскольку исследователи слишком много внимания уделяли тому, насколько велики были их статистические данные, а не насколько велики были их размеры. Это особенно важно, когда у вас большой размер выборки, когда даже небольшие эффекты могут быть статистически значимыми.
  • Большинство одномерных статистических данных не являются величинами эффекта. В большинстве случаев размер эффекта касается взаимосвязи, по крайней мере, между двумя переменными. Таким образом, среднее значение выборки, стандартное отклонение, перекос, эксцесс, минимальное, максимальное и т. Д. Не являются показателями величины эффекта.
  • Статистические данные, не относящиеся к степени взаимосвязи , не являются показателями величины эффекта. Например, тесты многомерной нормальности, собственные значения матрицы и т. Д., Как правило, не направлены непосредственно на количественную оценку эффекта в обычном смысле этого слова.

Более широкие соображения

  • Соображения по поводу масштабирования . Полезность статистики в качестве меры размера эффекта во многом связана с ее способностью сообщать о размере эффекта. Иногда это достигается с помощью знакомых стандартизированных мер воздействия (например, Коэна г). В других случаях тщательное рассмотрение масштабирования переменных может дать еще более четкую интерпретацию величины эффекта. Например, скажем, у меня было исследование по программе обучения по уровням доходов. Я мог бы сообщить, что программа обучения увеличила доход на 0,2 стандартных отклонения, или я мог бы сказать, что программа увеличила доход на 3500 долларов США. Оба полезны; оба являются измерениями эффекта. Первый стандартизирован (d Коэна), второй нестандартен (необработанные средние различия по группам).
  • Точность в оценке размеров эффекта: мы часто извлекаем выборочные оценки мер размера эффекта (например, d Коэна, r Пирсона и т. Д.). Этот контекст может привести к сопоставлению тестирования значимости с показателями величины эффекта. Тем не менее, цель по-прежнему должна состоять в том, чтобы точно и объективно оценить величину воздействия на население. С частой точки зрения доверительные интервалы вокруг размеров эффекта дают оценку точности. С байесовской точки зрения существуют задние плотности на величину эффекта. Во многих случаях необходимо соблюдать осторожность, чтобы убедиться, что вы используете объективную величину эффекта.
Джером англим
источник
1
(+1) Хороший ответ.
ЧЛ
Третий и последний пункты, вероятно, объясняют, откуда взялись автор (ы) статьи в Википедии. Учитывая акцент на психологии, я думаю, что дело не столько в том, чтобы сравнивать размер эффекта с другими описательными характеристиками, сколько в статистике теста и p-значениях (т.е. логической статистике), а также в том, что измерения размера эффекта ничего не говорят об изменчивости выборки.
Гала
Большое спасибо за ваш хороший ответ. У меня есть вопрос: вы имеете в виду доверительный интервал, который нельзя использовать в качестве меры размера эффекта, потому что он напрямую связан с размером выборки? (под доверительным интервалом я подразумеваю значение, которое и прибавляется, или вычитается из распространенности, среднего значения и т. д., а не верхнюю и нижнюю границы ДИ).
Вик
2
@Vic вы можете иметь доверительный интервал для меры размера эффекта, но сам доверительный интервал не является размером эффекта.
Джером Энглим
О, большое спасибо, дорогой Джероми. Все эти годы я ошибался. :)
Vic
6

Во-первых, величины эффекта могут использоваться как косвенно, так и описательно. r и OR - все величины эффекта и, безусловно, все они используются в логических выводах.

Одномерная статистика обычно не имеет размеров эффекта, хотя может быть. Например, если вы сравниваете возраст мужчин и женщин, состоящих в браке друг с другом, средний возраст мужчин не является величиной эффекта (тогда разница средних значений будет одной величиной эффекта). Но если вы хотите увидеть, если среднее значение чего-либо равно 0, тогда среднее значение будет величиной эффекта.

Если он измеряет эффект, это размер эффекта!

Питер Флом - Восстановить Монику
источник
Я предполагаю, что это правда @Peter, но размер эффекта - это термин, который был более узко определен Коэном: (Mean1-Mean2) / PooledSD. Это звучит немного похоже на то, является ли разница значимой или только статистически значимой - использование общих слов для определения статистического термина.
doug.numbers
2
Где Коэн определяет это так? Если вы имеете в виду его книгу по анализу мощности, я думаю, он использует это как своего рода стандарт для преобразования других величин эффекта. Но каждая таблица анализа мощности в этой книге (и есть много) использует некоторый размер эффекта (и не все используют этот)
Питер Флом - Восстановить Монику
1
Коэн д всегда так, как я понял. Аналогично описанному en.wikipedia.org/wiki/Effect_size . Но вы абсолютно правы, существует множество методов, описываемых как величина эффекта.
doug.numbers
4
T-критерий и z-критерий не являются величинами эффекта. один и тот же размер эффекта даст существенно разные значения t и z для разных размеров выборки.
Jeromy Anglim
1
@JeromyAnglim прав; +1. Я отредактировал свой ответ
Питер Флом - Восстановить Монику