Я полагал, что приведенные ниже прямоугольники могут быть интерпретированы как «большинство мужчин быстрее, чем большинство женщин» (в этом наборе данных), главным образом потому, что среднее время мужчин было меньше среднего времени женщин. Но курс EDX на R- и статистика викторине сказал мне , что это неправильно. Пожалуйста, помогите мне понять, почему моя интуиция неверна.
Вот вопрос:
Давайте рассмотрим случайную выборку финишеров с марафона в Нью-Йорке 2002 года. Этот набор данных можно найти в пакете UsingR. Загрузите библиотеку, а затем загрузите набор данных nym.2002.
library(dplyr) data(nym.2002, package="UsingR")
Используйте коробочные графики и гистограммы, чтобы сравнить конечное время мужчин и женщин. Что из следующего лучше всего описывает разницу?
- Мужчины и женщины имеют одинаковое распределение.
- Большинство мужчин быстрее, чем большинство женщин.
- Мужчины и женщины имеют схожие правосторонние распределения с первым, сдвинутым на 20 минут влево.
- Оба распределения обычно распределяются с разницей в среднем около 30 минут.
Вот марафон Нью-Йорка для мужчин и женщин в виде квантилей, гистограмм и коробочных графиков:
# Men's time quantile
0% 25% 50% 75% 100%
147.3333 226.1333 256.0167 290.6375 508.0833
# Women's time quantile
0% 25% 50% 75% 100%
175.5333 250.8208 277.7250 309.4625 566.7833
Ответы:
Я думаю, что причина, по которой вы были отмечены как неправильные, заключается не столько в том, что ответ, который вы дали на вопрос с несколькими выборами, был неправильным, а в том, что вариант 3 «Мужчины и женщины имеют схожие распределения с правым наклоном с первым, смещенным на 20 минут влево» было бы лучшим выбором, поскольку он более информативен на основе предоставленной информации.
источник
Вот самый маленький контрпример, который я смог найти:
A (
[1, 4, 10])
и B ([0, 6, 9]
) имеют одинаковое среднее значение (5
)B имеет большую медиану (
6
), чем A (4
)Вот еще один пример с 4 элементами:
источник
«Большинство мужчин быстрее, чем большинство женщин», возможно, немного двусмысленно, но я обычно интерпретирую намерение таково, что если мы посмотрим на случайные парировки, большую часть времени мужчина будет быстрее - то есть для случайных (где - «время для мужчины» и т. Д.). i,jMiiP(Mi<Fj)>12 i,j Mi i
Конечно, возможны и другие толкования фразы (в конце концов, это и есть двусмысленность), и некоторые из этих других возможностей могут соответствовать вашим рассуждениям.
[У нас также есть вопрос о том, говорим ли мы об образцах или группах населения ... «большинство мужчин [...] большинство женщин», кажется, является популяционным заявлением (о группе потенциальных времен), но мы наблюдали только времена что мы, кажется, рассматриваем как образец, поэтому мы должны быть осторожны с тем, насколько широко мы заявляем.]
Обратите внимание, что не подразумевается . Они могут идти в противоположных направлениях.˜ M < ˜ FP(Mi<Fj)>12 M˜<F˜
[Я не говорю, что вы ошибаетесь, думая, что доля случайных пар MF, где мужчина был быстрее, чем женщина, составляет более половины - вы почти наверняка правы. Я просто говорю, что вы не можете сказать это, сравнивая медианы. Вы также не можете сказать это, посмотрев на долю в каждом образце выше или ниже медианы другого образца. Вы должны сделать другое сравнение.]
То есть, хотя средний мужчина может быть быстрее, чем средняя женщина, можно иметь выборку времен (или, если на то пошло, постоянное распределение), когда вероятность того, что случайный мужчина быстрее случайной женщины, равна меньше чем . В больших выборках каждое из двух противоположных показаний может быть значительным.12
Пример:
Набор данных A:
Набор данных B:
Набор данных C:
(Данные здесь , но используются там для другой цели - насколько я помню, я сам их сгенерировал)
Обратите внимание, что доля A <B составляет 2/3, доля A <C составляет 5/9, а доля B <C составляет 2/3. Как A против B, так и B против C значимы на уровне 5%, но мы можем достичь любого уровня значимости, просто добавив достаточное количество копий образцов. Мы можем даже избежать связей, дублируя выборки, но добавляя достаточно крошечный джиттер (достаточно меньший, чем наименьший зазор между точками)
Выборочные медианы идут в другом направлении: медиана (A)> медиана (B)> медиана (C)
Опять же, мы могли бы добиться значимости для некоторого сравнения медиан - до любого уровня значимости - повторяя выборки.
Чтобы связать это с настоящей проблемой, представьте, что А - это «женские времена», а В - «мужские времена». Тогда среднее время мужчин быстрее, но случайно выбранный мужчина в 2/3 времени будет медленнее, чем случайно выбранная женщина.
Взяв наш пример из образцов A и C, мы можем сгенерировать больший набор данных (в R) следующим образом:
Медиана F будет около 16,25, а медиана M будет около 11,25, но доля случаев, когда F <M, будет 5/9.
[Если бы мы заменили n / 3 биномиальной переменной с параметрами и мы бы выборку из популяции, где медиана распределения F равна 16.25, а медиана распределения M - 11.25. Между тем в этой популяции вероятность того, что F <M снова будет 5/9.]1n 13
Также обратите внимание, что и а (на значительном расстоянии). P(M>med(F))=2P(F<med(M))=23 мед(М)<мед(F)P(M>med(F))=23 med(M)<med(F)
источник
Следующие цифры взяты из этого поста в блоге , который иллюстрирует важное практическое применение этих идей.
Стандартизация предоставляет мощное устройство для сравнения двух дистрибутивов. На следующих 3 рисунках сравниваются рост 130-месячных мальчиков и девочек из Национальной программы по измерению детей в Англии (NCMP). (Это был модальный возраст в этом наборе данных; я выбрал его просто, чтобы получить наибольшее количество данных и, следовательно, самые гладкие графики в пределах одной возрастной когорты.)
Рисунок 1: Рост мальчиков и девочек в возрасте 130 месяцев, из Национальной программы по измерению детей в Англии (NCMP)
Рисунок 2: Процент роста для мальчиков и девочек в возрасте 130 месяцев. Источник: английский NCMP
Рисунок 3: Распределение роста у девочек в возрасте 130 месяцев относительно мальчиков того же возраста.
На последнем из этих рисунков сравнение роста было стандартизировано в соответствии с ростом мальчиков. Таким образом, читая вдоль пунктирных серых линий на рисунке 3, вы можете сделать такие заявления, как:
Одна точка возможного замешательства в этом сюжете заслуживает упоминания. Хотя линия 45 ° мальчиков на графике «выше», чем пурпурная кривая девочек, это наблюдение, тем не менее, соответствует общеизвестному факту, что в этом возрасте (это шестиклассники), девочки, как правило, выше мальчиков , Обратите внимание, что эта высота правильно отражена в том факте, что пурпурная кривая смещена вправо относительно синей линии.
Ваш первоначальный вопрос теперь можно переформулировать в геометрических терминах, как вопрос о том, можете ли вы нарисовать пурпурную кривую на рис. 3, чтобы одновременно достичь (а) постулированного отношения между медианами и (б) слегка неуловимого отношения, которое @Glen_b выяснил (правильно, я считаю) в своем ответе. Интересно, могут ли распределительные разрывы (точечные массы в плотностях) привести к «патологическому» случаю? Я предполагаю, что любой такой патологический случай будет «исключением, подтверждающим правило».
С другой стороны, если фактическое намерение «большинство» было «> 50%», можно было бы ожидать, что будет использована более точная фраза «большинство». Если кто-то говорит мне, что что-то «вероятно» произойдет, я думаю, что субъективная вероятность 60% или более намекается на. Точно так же «большинство» для меня означает что-то вроде 70–80%. Очевидно, что из приведенного выше графика, если «большинство» принимается за критерий, более строгий, чем 52,5%, то нельзя сказать, что «большинство девочек [имеют свойство, которое они] выше, чем большинство мальчиков». Интересно, было ли частью логического обоснования вопроса о викторине стимулирование изучения слов, связанных с числовыми понятиями? (Если вы думаете, что все это немного глупо, рассмотрите эти графики, показывающий, как люди склонны интерпретировать разные вероятностные слова и фразы.) Возможно, целью было также подчеркнуть то, что в распределениях реального мира присутствует много вариаций, и что единственная статистика (медиана, среднее значение, что-есть- Вы) будете редко поддерживать широкие, широкие заявления.
источник