Влияет ли размер на знак Уилкоксона?

Некоторые авторы (например, Pallant, 2007, стр. 225; см. Изображение ниже) предлагают рассчитать величину эффекта для рангового теста Уилкоксона, разделив статистику теста на квадратный корень из числа наблюдений:

$r = \frac{Z}{\sqrt{n_x + n_y}}$

Zявляется выводом статистики теста по SPSS (см. изображение ниже), а также по wilcoxsign_testR. (См. также мой связанный вопрос: teststatistic vs linearstatistic в wilcoxsign_test )

Другие предлагают Браве-Пирсон ( ) или Спирмен ( $r = \frac{cov(XY)}{sd(X) \times sd(Y)}$ $r_S$ корреляции ) (в зависимости от типа данных).

Когда вы рассчитываете их, два r даже отдаленно не одинаковы. Например, для моих текущих данных:

r = 0,23 (для $r = \frac{Z}{\sqrt{n_x + n_y}}$ )

r = 0,43 (Пирсон)

Это подразумевало бы совершенно разные размеры эффекта.

Итак, какой правильный размер эффекта использовать, и как они rсвязаны друг с другом?

Страницы 224 (нижняя часть) и 225 от Pallant, J. (2007). SPSS Survival Manual:

введите описание изображения здесь

effect-size wilcoxon-signed-rank Сообщество
источник

Ах да, похоже, вот и все .

Glen_b

Я бы предпочел оставить все как есть - если Браве заслуживает доверия на одном языке, он заслуживает его на другом! Я ценю заполнение пробела в моем образовании.

Glen_b

Да, потому что мне нужен тест, который может справиться со связями.

n

\sqrt{n}

$\sqrt{n}$

n = n_{x} + n_{y}

$n = n_x + n_y$

Я лично думал, что Z / sqrt (n) может быть одним из вариантов. Википедия о Манн-Уитни ссылается на документ в формате pdf Кирби, в котором также рассматривается пара Уилкоксона; Я не читал статью сам.

ttnphns

Ответы:

Если у вас нет связей, я бы сообщил о доле после значений, которые меньше, чем соответствующие значения до.
Если у вас есть связи, вы можете указать долю значений после, которые меньше, чем прежде, из общего числа несвязанных пар, или сообщить все три пропорции (<, =,>) и, возможно, сумму двух, которые были более значимым. Например, вы могли бы сказать, что «у 33% меньше страха перед статистикой, 57% не изменились, а у 10% больше страха после курса, так что 90% были такими же или лучше, чем раньше».

$N$ $z$ $\sqrt N$ $z/\sqrt N$ $z/\sqrt N$

Хотя есть и другая морщина. Несмотря на то, что вы хотите оценить величину общего эффекта, люди обычно используют критерий рангового ранга Уилкоксона с данными, которые являются только порядковыми. То есть там, где они не верят, что данные могут достоверно указывать величину сдвига в ученике, но только то, что сдвиг произошел. Это подводит меня к пропорции улучшения, обсужденной выше.

С другой стороны, если вы действительно верите, что значения имеют внутреннюю значимость (например, вы использовали только критерий ранга со знаком для его устойчивости к нормальности и выбросам), вы можете просто использовать необработанное среднее или срединное различие, или стандартизированное среднее различие в качестве меры эффекта.

Gung - Восстановить Монику
источник

+1 Ваши предлагаемые меры эффекта легко понятны и также относятся к статистике теста.

Джон

Не зная, какие данные оцениваются, очень сложно дать хороший совет здесь. И действительно, это все, что вы можете получить. Просто нет такой вещи, как лучшая мера величины эффекта для подобных вопросов ... возможно, когда-либо.

Размеры эффекта, упомянутые в вопросе, представляют собой стандартизированные размеры эффекта. Но вполне возможно, что средства или медианы оригинальных мер просто хороши. Например, если вы измеряете, сколько времени требуется для завершения производственного процесса, тогда разница во времени должна быть совершенно разумной величиной эффекта. Любые изменения в процессе, будущие измерения, измерения в системах и измерения на фабриках будут все вовремя. Может быть, вы хотите получить среднее значение, или, может быть, вы хотите медиану или даже режим, но первое, что вам нужно сделать, это взглянуть на фактическую шкалу измерения и посмотреть, является ли размер эффекта разумным для интерпретации и тесно связан с измерением.

Чтобы помочь обдумать это, эффекты, которые должны быть стандартизированы, измеряются более косвенно и разными способами. Например, психологические шкалы могут изменяться во времени и разными способами и пытаться найти базовую переменную, которая не оценивается напрямую. В этих случаях вы хотите стандартизированные размеры эффекта.

При стандартизированных величинах эффекта критической проблемой является не только то, что использовать, но и то, что они значат. Как вы подразумеваете в своем вопросе, вы также не знаете, что они значат, и это очень важно. Если вы не знаете, что такое стандартизированный эффект, вы не сможете сообщить о нем правильно, интерпретировать его правильно или использовать его правильно. Кроме того, если вы хотите обсудить данные различными способами, вам абсолютно ничего не помешает сообщить о более чем одном размере эффекта. Вы можете обсудить ваши данные с точки зрения линейных отношений, например, с учетом соотношения момента продукта или с точки зрения отношений между рядами с Spearmanrи различия между ними или просто предоставить всю информацию в таблице. В этом нет ничего плохого. Но больше всего вам придется решить, что вы хотите, чтобы означали ваши результаты. Это то, на что нельзя ответить из предоставленной информации, и может потребовать гораздо больше информации и знаний по конкретным областям, чем разумно для вопроса на форуме такого рода.

И всегда думайте мета-аналитически о том, как вы сообщаете о последствиях. Смогут ли люди в будущем взять результаты, о которых я сообщаю, и интегрировать их с другими? Возможно, в вашей области есть стандарт для этих вещей. Возможно, вы выбрали непараметрический тест прежде всего потому, что вы не доверяете выводам, сделанным другими о базовых дистрибутивах, и хотите быть более консервативными в своих предположениях в области, в которой в основном используются параметрические тесты. В этом случае нет ничего плохого в дополнительном предоставлении размера эффекта, обычно используемого в параметрических тестах. Эти и многие другие вопросы необходимо учитывать, когда вы думаете о том, как вы разместите свои выводы в более обширной литературе по аналогичным исследованиям. Как правило, хорошая описательная статистика решает эти проблемы.

Так что это основной совет. У меня есть несколько дополнительных комментариев. Если вы хотите, чтобы ваш размер эффекта был тесно связан с тестом, который вы сделали, то Zобоснованная рекомендация, очевидно, является лучшей. Ваш стандартизированный размер эффекта будет означать то же самое, что и тест. Но как только вы этого не сделаете, нет ничего плохого в использовании чего-либо еще, даже такого, как у Коэна, dкоторое связано с параметрическими тестами. Там нет предположения о нормальности для расчета средних, стандартных отклонений илиdбаллы. На самом деле, есть более слабые предположения, чем для рекомендуемого коэффициента корреляции. И всегда сообщайте о хороших описательных мерах. Опять же, описательные меры не имеют допущений, которые вы бы нарушили, но имейте в виду их существенное значение. Вы сообщаете описательную статистику, которая говорит что-то о ваших данных, которые вы хотите сказать, и означает, что медианы говорят разные вещи.

Если вы хотите обсудить повторяющиеся измерения в сравнении с независимыми размерами эффекта дизайна, тогда это действительно новый вопрос.

Джон
источник