Вы должны использовать подписанный тест ранга, когда данные сопряжены .
Вы найдете много определений спаривания, но в глубине души критерием является то, что делает пары значений как минимум несколько положительно зависимыми, в то время как непарные значения не являются зависимыми. Часто спаривание зависимостей происходит потому, что это наблюдения на одной и той же единице (повторные измерения), но это не обязательно должно быть на одной и той же единице, просто в некотором роде, как правило, связанное (при измерении одного и того же вида вещей) , чтобы считаться «парным».
Вы должны использовать критерий суммы ранга, когда данные не спарены.
Это в основном все, что нужно сделать.
Обратите внимание, что наличие одного и того же не означает, что данные являются парными, а наличие другого nNN не означает, что пары не существует (возможно, несколько пар потеряли наблюдение по какой-то причине). Спаривание происходит из рассмотрения того, что было выбрано.
Эффект использования парного теста, когда данные являются парными, заключается в том, что он обычно дает больше возможностей для обнаружения интересующих вас изменений. Если связь приводит к сильной зависимости *, тогда выигрыш в мощности может быть существенным.
* в частности, но если говорить несколько свободно, если величина эффекта велика по сравнению с типичным размером парных различий, но мала по сравнению с типичным размером непарных различий, вы можете подобрать разницу с помощью парного теста в довольно маленький размер выборки, но с непарным тестом только при гораздо большем размере выборки.
Однако, когда данные не сопряжены, может быть (по крайней мере, немного) контрпродуктивно рассматривать данные как сопряженные. Тем не менее, стоимость - в случае потери мощности - может во многих случаях быть довольно небольшой - исследование мощности, которое я провел в ответ на этот вопрос, по-видимому, предполагает, что в среднем потери мощности в типичных ситуациях малой выборки (скажем, для n порядка от 10 до 30 в каждом образце после поправки на различия в уровне значимости) может быть удивительно небольшим.
[Если вы почему-то действительно не уверены, являются ли данные парными или нет, потери при обработке непарных данных как парных обычно относительно незначительны, в то время как выгоды могут быть существенными, если они спарены. Это говорит о том, что если вы действительно не знаете, и у вас есть способ выяснить, что связано с тем, что предполагается, что они были связаны - например, значения находятся в одной строке таблицы, на практике может иметь смысл действовать как если бы данные были спарены, чтобы быть в безопасности - хотя некоторые люди могут проявлять излишнюю физическую нагрузку из-за того, что вы делаете это.]