Каковы хорошие способы визуализации множества ответов Лайкерта?
Например, набор вопросов, спрашивающих о важности X для чьих-либо решений об A, B, C, D, E, F & G? Есть ли что-то лучше, чем гистограммы?
- Что делать с ответами N / A? Как они могут быть представлены?
- Должны ли гистограммы отображать проценты или количество ответов? (т.е. должны ли бары иметь одинаковую длину?)
- Если проценты, должен ли знаменатель включать недействительные и / или нет ответов?
У меня есть свои взгляды, но я ищу идеи других людей.
R
пользователей, что эти виды графиков реализованы в пакетеHH
. Чтобы произвести впечатление, вы можете попробоватьlikert(t(apply(data, 2, table)))
.Сложенные столбцы, как правило, хорошо понимаются статистиками, если их осторожно представить. Полезно масштабировать их по общему метрику (например, 0-100%), с постепенным цветом для каждой категории, если они являются порядковыми (например, Лайкерт). Я предпочитаю точечную диаграмму (точечный график Кливленда), когда не слишком много предметов и не более 3-5 категорий ответов. Но это действительно вопрос визуальной ясности. Я обычно предоставляю%, поскольку это стандартизированная мера, и сообщаю только% и подсчеты с диаграммой без суммирования. Вот пример того, что я имею в виду:
Лучшего рендеринга можно достичь с помощью
lattice
илиggplot2
. Все элементы имеют одинаковые категории ответов в этом конкретном примере, но в более общем случае мы можем ожидать разные, так что показ всех из них не будет казаться избыточным, как в данном случае. Однако можно было бы придать одинаковый цвет каждой категории ответов, чтобы облегчить чтение.Но я бы сказал, что составные столбцы лучше, когда все элементы имеют одинаковую категорию ответов, так как они помогают оценить частоту одного способа ответа между элементами:
Я также могу подумать о какой-то тепловой карте, которая полезна, если есть много предметов с похожей категорией ответов.
Следует сообщать об отсутствующих ответах (особенно если они незначительны или локализованы на конкретный элемент / вопрос), в идеале для каждого элемента. Как правило,% ответов для каждой категории рассчитываются без NA. Это то, что обычно делается в опросе или психометрии (мы говорим о «выраженных или наблюдаемых ответах»).
PS Я могу думать о более необычных вещей , как на картинке показано ниже (первая была сделана вручную, второй из
ggplot2
,ggfluctuation(as.table(tab))
), но я не думаю , что это передать в качестве точной информации dotplot или столбиковых , поскольку поверхностные вариации трудно оценить.источник
Я думаю, что ответ ЧЛ это здорово.
Одна вещь, которую я мог бы добавить, это случай, когда вы хотите сравнить соотношение между предметами. Для этого вы можете использовать что-то вроде корреляционной матрицы рассеяния для упорядоченных категориальных данных.
(Этот код все еще нуждается в доработке - но он дает общую идею ...)
источник
pairs.panels
функции вpsych
пакете W Revelle.