У меня есть некоторые порядковые данные, которые обычно не распространяются, поэтому я решил провести непараметрическое тестирование, используя U-критерий Манна-Уитни. Я смотрю на различия между группами по семи баллам - эти баллы равны 0, 1, 2 или 3 для каждого предмета. Мне сложно понять, как отобразить мои данные!
Если я представлю данные, используя медианы (и IQR медиан), то вообще неясно, где различия, потому что медианы по большей части падают либо на 0, либо на 1. Таким образом, несмотря на то, что U-критерий Манна-Уитни показывает значительные различия, стол выглядит просто неинтересно.
Я мог бы также представить данные, используя средства . Существуют некоторые научные статьи, в которых говорится, что вы можете использовать средства с порядковыми данными, но вы не можете делать такие же предположения относительно различий между оценками (например, разница между 0 и 1 не такая, как между 1 и 1). 2). Использование средств будет немного спорным, хотя цифры в таблице хорошо рассказывают историю, когда я их использую.
Третий вариант - использование средних рангов, которые SPSS дает мне в выводе Манна-Уитни. Средние ранги - это то, что сравнивают между группами, так что, может быть, я должен просто использовать их? Единственная проблема, с которой я столкнулся, заключается в том, что средние ранги на самом деле ничего не значат в отношении фактических данных (например, я не вижу, чтобы объекты были ближе к 3, в то время как элементы управления ближе к 1 с использованием средних рангов).
И последний вариант заключался в проведении анализа хи-квадрат, сравнивая предметы и контроли после разделения баллов на две группы (0 и 1 для низкого и 2 и 3 для высокого). Однако, когда я это сделал, различия были не такими выраженными (вероятно, по ряду причин).
Ответы:
Это отличный вопрос. Как вы обнаружили, квантили не работают, когда в данных много связей, потому что они слишком прерывисты, как оценки. Я часто нахожу, что средства работают лучше всего, если вы можете предположить, что расстояние между категориями, по крайней мере, «наполовину значимо». Вероятности превышения всегда действительны. В вашем случае они будут оцениваться по доле наблюдений . Средние ранги полезны при сравнении групп, но я не вижу особой пользы для одной переменной.≥1,≥2,=3
Правильность использования среднего для суммирования порядковых переменных редко может быть получена из самих данных. Это субъективно.
Вместо того чтобы использовать средние ранги, я бы использовал подходящую меру корреляции рангов или вероятность конкорданса (простой линейный перевод статистики Уилкоксона-Манна-Уитни; это средний ранг наблюдений в одной из двух групп, разделенных на константу) между две переменные (например, двоичная группировка и порядковый масштаб). Выбор коэффициентов корреляции включает Сомерса (который соответствует вероятности согласования и штрафует за связи по порядковой переменной) и Goodman-Kruskal который не штрафует за связи по или .Dxy γ x y
источник