Контекст:
У меня есть два набора данных из одной и той же анкеты за два года. Каждый вопрос измеряется по 5-балльной шкале.
Q1: схема кодирования
На данный момент я закодировал свои ответы с интервалом [0, 1], где 0 означает «наиболее отрицательный ответ», 1 означает «наиболее положительный ответ», а другие ответы равномерно распределены между ними.
- Какую «лучшую» схему кодирования использовать для шкалы Лайкерта?
Я понимаю, что это может быть немного субъективно.
Q2: значение по годам
- Как лучше всего определить, есть ли статистически значимые изменения за два года?
То есть, глядя на результаты по вопросу 1 для каждого года, как мне определить, является ли разница между результатом 2011 года и результатом 2010 года статистически значимой? У меня есть смутное воспоминание о том, что t-критерий Стьюдента здесь используется, но я не уверен.
источник
Тест Уилкоксона Ранксума, иначе Манна-Уитни, - это путь в случае порядковых данных. Решение по начальной загрузке также элегантно, хотя и не «классический» путь. Метод начальной загрузки также может быть полезен, если вы стремитесь к другим вещам, таким как факторный анализ. В случае регрессионного анализа вы можете выбрать упорядоченный пробит или упорядоченный логит в качестве спецификации модели.
Кстати: если ваша шкала имеет больший диапазон (> 10 значений на переменную), вы можете использовать результаты в качестве метрической переменной, что делает t-тест безопасным выбором. Имейте в виду, что это немного грязно и некоторые могут считать работой дьявола.
Stephan
источник