Я создал веб-страницу, на которой публикуются живые результаты олимпийских медалей от Thompson Reuters и подсчет населения по всему миру из ЦРУ.
Результаты интересны для меня - у Венгрии двузначное лидерство в золотых медалях над остальным миром. Кроме того, США и Китай находятся на самом низком уровне практически в каждой категории.
У меня вопрос - представляю ли я данные честно? Я просто взял наибольшее население, а затем создал фактор для каждой страны на основе этого. Столбцы относительного количества медалей основаны на этом факторе.
Какие столбцы я могу добавить? Какие еще факторы я могу добавить, чтобы представить наиболее справедливый взгляд? Абсолютная точка зрения проста - Reuters делает это. Как создать честный вид?
statistical-significance
Ронни Ройстон
источник
источник
Ответы:
Вы пытаетесь найти оценку шанса любого человека выиграть медаль, зная, что «данные», которые мы имеем, это просто число по стране. Это отличный вопрос, справедливое решение, которое ближе к духу Олимпиады.
По сути, это статистическая проблема, которая хорошо аппроксимируется вашим методом как среднее количество (частота) медалей (для каждого цвета) по отношению к населению. Но насколько надежен этот метод? Это довольно близко к проблеме оценки надежности биномиального броска по разному количеству бросков, которое имеет приложения, например, для сравнения качества посредников в Amazon на основе разных чисел обратной связи (см. Это подробное объяснение ).
В этом конкретном случае численность населения всегда достаточна для того, чтобы приблизить бета-распределение к нормальному, так что, безусловно, можно сравнить значимость каждой оценки для каждой страны.
источник