Эта статья выше моей лиги, но в ней говорится о теме, которая меня интересует, о связи между средним, модой и медианой. Это говорит:
Широко распространено мнение, что медиана унимодального распределения «обычно» между средним и модой. Однако это не всегда так ...
Мой вопрос : может ли кто-нибудь привести примеры непрерывных унимодальных (идеально простых) распределений, где медиана находится вне интервала [mode, mean]? Например, такой дистрибутив, как mode < mean < median
.
=== РЕДАКТИРОВАТЬ =======
Уже есть хорошие ответы от Glen_b и Фрэнсиса, но я понял, что я действительно заинтересован в примере, где мода <среднее <медиана или медиана <среднее <мода (то есть и медиана находится за пределами [мода, означает] И медиана «на той же стороне», что и среднее значение для режима (т. е. для режима выше или ниже). Я могу принять ответы здесь, открыть новый вопрос или, может быть, кто-то может предложить решение здесь напрямую?
Ответы:
Конечно, нетрудно найти примеры - даже непрерывные унимодальные - где медиана не находится между средним и модальным.
Рассмотрим из треугольного распределения видаf T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2 fT(t)=2(1−t)10<t<1
Теперь пусть будет смесью 60-40 и .T 1 - 4 T 2X T1 −4T2
Плотность выглядит следующим образом:X
Среднее значение ниже 0, режим на 0, но медиана выше 0. Небольшая модификация этого приведет к примеру, где даже плотность (а не просто cdf) была непрерывной, но связь между мерами местоположения была то же самое (редактировать: см. 3. ниже).
Обобщая, давайте поместим пропорцию (с ) полной вероятности в правый треугольник и пропорцию в левый треугольник (вместо 0,6 и 0,4). у нас было раньше). Далее, сделайте коэффициент масштабирования в левой половине а не (с ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p 0<p<1 (1−p) −β −4 β>0
Предполагая теперь, что , медиана всегда будет в интервале, охватываемом прямоугольным треугольником, поэтому медиана будет превышать режим (который всегда будет оставаться в ). В частности, когда , медиана будет равна . 0p>1p>12 0 1-1/√p>12 1−1/2p−−√
Среднее значение будет при .(p−β(1−p))/3
Если то среднее значение будет ниже моды, а если среднее будет выше моды.β>p/(1−p) β<p/(1−p)
С другой стороны, мы хотим, чтобы сохранял среднее значение ниже медианы.(p−β(1−p))/3<1−1/2p−−√
Рассмотрим ; это ставит медиану выше моды.p=0.7
Тогда будет удовлетворять поэтому среднее значение выше моды.β=2 β<p/(1−p)
Медиана на самом деле составляет то время как среднее значение составляет . Следовательно, для и у нас есть мода <среднее <медиана.1−1/1.4−−−√≈0.1548 0.7−2(0.3)3≈0.0333 p=0.7 β=2
(NB. Для согласованности с моими обозначениями переменная на оси x для обоих графиков должна быть а не но я не собираюсь возвращаться и исправлять ее.)x t
Это пример, где сама плотность непрерывна. Он основан на подходе, описанном в пунктах 1. и 2. выше, но с заменой «скачка» на крутой склон (а затем вся плотность перевернулась примерно на 0, потому что я хочу, чтобы пример выглядел вправо).
[Используя подход «смеси треугольных плотностей», он может быть сгенерирован как смесь 3 независимых масштабированных вариаций треугольной формы, описанных в разделе 1. Теперь у нас есть 15% , 60% и 25% .]T1 −3T2 5T3
Как мы видим на диаграмме выше, среднее значение находится посередине, как и требовалось.
Обратите внимание, что m_t_ упоминает Вейбулла в комментариях (для которых медиана находится вне интервала для небольшого диапазона параметра формы ). Это потенциально удовлетворительно, потому что это хорошо известное унимодальное непрерывное (и гладкое) распределение с простой функциональной формой.[mode,mean] k
В частности, для малых значений параметра формы Вейбулла распределение является асимметричным, и мы имеем обычную ситуацию медианы между модой и средним значением, в то время как для больших значений параметра формы Вейбулла распределение является левосторонним. и мы снова имеем эту ситуацию «медиана в середине» (но теперь с модой справа, а не со средним значением). Между этими случаями находится небольшая область, где медиана находится за пределами интервала средней моды, а в середине этого значения среднее значение и мода пересекаются:
Выбирая удобные значения для параметра формы в интервалах, отмеченных (1) и (2) выше - те, где промежутки между статистикой местоположения примерно равны - мы получаем:
Хотя они удовлетворяют требованиям, к сожалению, три параметра местоположения находятся настолько близко друг к другу, что мы не можем визуально различить их (все они попадают в один и тот же пиксель), что немного разочаровывает - случаи для моих предыдущих примеров гораздо более разделены. (Тем не менее, он предлагает ситуации для изучения с другими распределениями, некоторые из которых могут дать результаты, которые являются более визуально отличными.)
источник
Следующий пример взят из контрпримеров Джордана Стоянова по вероятности .
Учитывая положительную постоянную и , рассмотрим случайную величину с плотностью Среднее значение , медиана и мода для можно найти как Примечание является плотностью, только если Поэтому, если мы допустим то . В результате, если мы выберем это близко кc λ X
источник
Возьмите экспоненциальное распределение с параметром скорости a и плотностью a exp (-ax) для 0 <= x <бесконечность. Режим в нуле. Конечно, среднее значение и медиана больше 0. Cdf - 1-exp (-ax). Поэтому для медианы решите для exp (-ax) = 0,5 для x. Тогда -ax = ln (0.5) или x = -ln (0.5) / a. Для среднего интегрируем ax exp (-ax) от 0 до бесконечности. Возьмем a = 1, и мы имеем медиану = -ln (0.5) = ln (2) и среднее значение = 1.
Таким образом, режим <средний <средний.
источник