У меня есть некоторые порядковые данные, полученные из вопросов опроса. В моем случае это ответы в стиле Лайкерта (категорически не согласен-не согласен-нейтрален-согласен-полностью согласен). По моим данным они кодируются как 1-5.
Я не думаю, что средства здесь много значат, так что какая основная сводная статистика считается полезной?
descriptive-statistics
likert
ordinal-data
PaulHurleyuk
источник
источник
Ответы:
Таблица частот - хорошее место для начала. Вы можете сделать подсчет и относительную частоту для каждого уровня. Также могут быть полезны общее количество и количество пропущенных значений.
Вы также можете использовать таблицу сопряженности для сравнения двух переменных одновременно. Может отображаться с использованием мозаичного графика тоже.
источник
Я собираюсь утверждать с прикладной точки зрения, что среднее часто является лучшим выбором для суммирования центральной тенденции элемента Лайкерта. В частности, я имею в виду такие контексты, как опросы удовлетворенности студентов, шкалы исследования рынка, опросы общественного мнения, тесты личности и многие социологические опросы.
В таких условиях потребители исследований часто хотят получить ответы на такие вопросы, как:
Для этих целей среднее имеет несколько преимуществ:
1. Среднее значение легко рассчитать:
2. Среднее значение относительно хорошо понято и интуитивно понятно:
0, 0, 0, 1, 1
кодированием.3. Среднее значение - это одно число:
4. Это не имеет большого значения
источник
Что касается базовых резюме, я согласен с тем, что таблицы частоты отчетов и некоторые признаки центральной тенденции - это хорошо. Например, в недавней статье, опубликованной в PARE, обсуждались t-тест MWW, пятиточечные элементы Лайкерта: t-тест против Манна-Уитни-Уилкоксона .
Для более детального лечения я бы порекомендовал прочитать обзор Агрести по упорядоченным категориальным переменным:
Он в значительной степени выходит за рамки обычной статистики, такой как модель на основе порогов (например, пропорциональное отношение шансов), и его стоит прочитать вместо книги Агрести CDA .
Ниже я показываю картину трех разных способов обработки предмета Лайкерта; сверху вниз, «частотное» (номинальное) представление, «числовое» представление и «вероятностное» представление (модель частичного кредитования ):
Данные поступают из
Science
данных вltm
пакете, где пункт касается технологии («Новая технология не зависит от фундаментальных научных исследований», с ответом «категорически не согласен» на «полностью согласен», по четырехбалльной шкале)источник
Обычной практикой является использование непараметрической статистики рангов суммы и среднего ранга для описания порядковых данных.
Вот как они работают:
Сумма рангов
присвоить звание каждому члену каждой группы;
например, предположим, что вы смотрите на цели для каждого игрока в двух противостоящих футбольных командах, а затем оцените каждого участника в обеих командах от первого до последнего;
рассчитать сумму рангов путем сложения рангов по группе ;
величина суммы ранга говорит вам, насколько близко друг к другу ранги для каждой группы
Средний рейтинг
M / R является более сложной статистикой, чем R / S, потому что она компенсирует неравные размеры в сравниваемых группах. Следовательно, в дополнение к описанным выше шагам вы делите каждую сумму на количество участников в группе.
Получив эти две статистические данные, вы можете, например, выполнить z-тест ранговой суммы, чтобы увидеть, является ли разница между двумя группами статистически значимой (я полагаю, это известно как критерий суммы рангов Уилкоксона , который является взаимозаменяемым, то есть функционально эквивалентно U-критерию Манна-Уитни).
R Функции для этой статистики (те, о которых я в любом случае знаю):
wilcox.test в стандартной установке R
meanranks в Шатуны Пакет
источник
На основании реферата Эта статья может быть полезна для сравнения нескольких переменных, которые имеют шкалу Лайкерта. Он сравнивает два типа непараметрических множественных сравнительных тестов: один на основе рангов и один на основе теста Чакко. Это включает в себя симуляции.
источник
Я обычно люблю использовать мозаичный сюжет. Вы можете создать их, включив другие ковариаты интереса (такие как: пол, стратифицированные факторы и т. Д.)
источник
Я согласен с оценкой Джерома Англима. Помните, что ответы Лайкерта являются оценками - вы не используете совершенно надежную линейку для измерения физического объекта со стабильными размерами. Среднее значение является мощной мерой при использовании разумных размеров выборки.
В сфере бизнеса и исследований и разработок среднее значение является наиболее распространенной статистикой, используемой в шкалах Лайкерта. При использовании шкал Лайкерта я обычно выбирал меру, которая идеально подходит для вопроса исследования. Например, если вы говорите о «предпочтениях» или «отношениях», вы можете использовать несколько индикаторов на основе Лайкерта, каждый из которых обеспечивает несколько иную информацию.
Чтобы оценить вопрос «как люди в сегменте реагировать на предложение услуг », я могу посмотреть на (1) среднее арифметическое, (2) точную медиану, (3) процент наиболее благоприятных ответов (верхняя часть), (4)% верхние два блока, (5) отношение двух верхних блоков к нижним двум полям, (6) процентное соотношение в полях среднего диапазона ... и т. д. Каждая мера рассказывает отдельную часть истории. В очень важном проекте я использую несколько индикаторов на основе Лайкерта. Я также буду использовать несколько индикаторов с небольшими выборками и когда конкретная кросс-таблица имеет «интересную» структуру или выглядит насыщенной информацией. Аааа ... искусство статистики.хi X
источник
«Коробочные баллы» часто используются для обобщения порядковых данных, особенно когда речь идет о значимых словесных привязках. Другими словами, вы можете сообщить о «верхнем 2 ящике», проценте, который выбрал «согласен» или «полностью согласен».
источник