Если я правильно понимаю, рейтинги книг по шкале от 1 до 5 - это баллы Лайкерта. То есть 3 для меня не обязательно может быть 3 для кого-то еще. Это порядковая шкала ИМО. На самом деле не следует усреднять порядковые шкалы, но определенно можно выбрать моду, медиану и процентили.
Так можно ли нарушать правила, поскольку большая часть населения понимает средства, а не приведенные выше статистические данные? Хотя исследовательское сообщество решительно осуждает принятие средних значений данных, основанных на шкале Лайкерта, нормально ли это делать с массами (практически говоря)? Является ли взятие среднего значения в этом случае даже вводящим в заблуждение?
Кажется маловероятным, что такая компания, как Amazon, будет искать основную статистику, но если нет, то чего мне здесь не хватает? Можем ли мы утверждать, что порядковый масштаб является удобным приближением к порядковому порядку, чтобы оправдать взятие среднего? На каком основании?
источник
Ответы:
Преимущества использования среднего для суммирования центральной тенденции 5-балльной оценки
Как упомянул @gung, я думаю, что часто есть очень веские причины для того, чтобы брать среднее значение из пяти пунктов как показатель центральной тенденции. Я уже изложил эти причины здесь .
Перефразировать:
Почему среднее хорошо для Амазонки
Подумайте о целях Amazon в сообщении среднего значения. Возможно, они стремятся
Amazon предоставляет своего рода округленное среднее, подсчет частоты для каждого варианта рейтинга и размер выборки (т. Е. Количество оценок). Эта информация, по-видимому, достаточна для большинства людей, чтобы оценить как общее настроение в отношении элемента, так и уверенность в таком рейтинге (т. Е. 4,5 с 20 оценками с большей вероятностью будут точнее, чем 4,5 с 2 оценками; элемент с 10 5 -звездочный рейтинг, и один 1-звездочный рейтинг без комментариев, все еще может быть хорошим элементом).
Вы могли даже видеть скупость как демократический вариант. Многие выборы решаются на основе того, какой кандидат получает наибольшее среднее значение по двухбалльной шкале. Точно так же, если вы возьмете аргумент, что каждый человек, который представляет обзор, получает голос, тогда вы можете видеть среднее значение как форму, которая одинаково взвешивает голос каждого человека.
Являются ли различия в использовании масштаба действительно проблемой?
В психологической литературе известен широкий диапазон рейтинговых искажений (обзор см. Saal et al 1980), таких как смещение центральной тенденции, смещение снисходительности, смещение строгости. Кроме того, некоторые оценщики будут более произвольными, а некоторые - более надежными. Некоторые могут даже систематически лгать, давая ложные положительные или ложные отрицательные отзывы. Это создаст различные формы ошибок при попытке вычислить истинную среднюю оценку для элемента.
Однако, если бы вы выбрали случайную выборку из популяции, такие искажения могли бы компенсировать, и при достаточном размере выборки оценщиков вы все равно получили бы истинное среднее значение.
Конечно, вы не получаете случайную выборку на Amazon, и есть риск того, что определенный набор оценщиков, которые вы получаете за элемент, систематически смещен, чтобы быть более снисходительным или строгим, и так далее. Тем не менее, я думаю, что пользователи Amazon будут благодарны за то, что пользовательские рейтинги исходят из несовершенного образца. Я также думаю, что вполне вероятно, что при разумном размере выборки во многих случаях большинство различий в откликах отклика начнут исчезать.
Возможные достижения выше среднего
С точки зрения повышения точности оценки, я бы не стал оспаривать общую концепцию среднего значения, а скорее я думаю, что есть и другие способы оценки истинного среднего значения рейтинга по предмету (т. Е. Среднего рейтинга, который будет получен). были большие репрезентативные выборки попросили оценить элемент).
Таким образом, если точность в рейтинге была главной целью Amazon, я думаю, что она должна стремиться увеличить количество рейтингов на единицу и принять некоторые из вышеуказанных стратегий. Такие подходы могут быть особенно важны при создании рейтинга лучших. Однако для скромного рейтинга на странице вполне может оказаться, что выборочное значение лучше соответствует целям простоты и прозрачности.
Рекомендации
источник
Чтобы быть несколько техническим здесь, эти рейтинги на самом деле не шкала Лайкерта ; это просто порядковые рейтинги. Сказав это, ваша точка зрения по существу верна. Тем не менее, я часто думаю, что слишком много сделано из этой проблемы. Следует отметить, что обычно подразумевается, что среднее число порядковых элементов может быть приблизительно интервальным, и, таким образом, при наличии множества оценок среднее значение становится более разумным представлением. Я нашел этот ответ @JeromyAnglim отличным (действительно, вопрос и все сопутствующие ответы там стоит прочитать). Для более теоретического лечения, смотрите здесь, С другой стороны, мне нравится Amazon, но я не вижу причин ожидать от них изощренности в области статистики, особенно с точки зрения базового дизайна сайта - суть заключается в удобстве использования пользователями, а не в впечатлении от преподавателей статистики.
источник
У всех есть хорошие мнения по этому поводу. Я не думаю, что могу добавить намного больше. Тем не менее, я опубликую это :
источник
По моему опыту, среднее значение данных шкалы оценок часто наиболее тесно связано с уровнем реальных показателей, которые мы пытаемся связать с шкалой оценок. Мы нашли много линейных отношений, и поэтому среднее значение является одним из лучших способов суммировать данные. При этом, как отметил Джероми, большинство способов анализа центральной тенденции рейтинговой шкалы в большинстве случаев даст аналогичные результаты (ранговые порядки и т. Д.).
Кроме того, я подозреваю, что Amazon, вероятно, не все, что так или иначе касается научной обоснованности. В конце концов, цель Amazon состоит в том, чтобы заставить людей делать покупки на Amazon.com, и способ, которым обзоры помогают достичь этого, вероятно, не будет меняться в зависимости от того, какое резюме будет использоваться. Хорошие продукты будут вознаграждены, действительно плохие продукты наказаны, и нервные покупатели будут иметь возможность рассмотреть плюсы и минусы более подробно.
источник
Рейтинги Amazon вводят в заблуждение из-за компаний, разыгрывающих систему. Когда клиентам предлагаются скидки и бесплатный товар в обмен на 5-звездочных обзоров, «Статистика» того, что число оценок является или средства становятся спорными.
источник
Ты делаешь доброе дело. Принятие среднего числа по порядку несколько вводит в заблуждение. Любая сводка по нескольким рейтингам пострадает от того факта, что моя субъективная 3 может действительно приравниваться к вашей 4. Поэтому объединение различных индивидуальных баллов, вероятно, является самой большой проблемой. Интерпретация среднего значения 3 и 4 как 3,5 не столь вопиющая.
источник