Как ожидаемое значение соотносится со средним, медианным и т. Д. В ненормальном распределении?

9

Как ожидаемое значение непрерывной случайной величины связано с ее средним арифметическим, медианой и т. Д. В ненормальном распределении (например, косо-нормальное)? Меня интересуют любые распространенные / интересные дистрибутивы (например, log-normal, простые bi / multimodal дистрибутивы, что-нибудь еще странное и замечательное).

Я в основном ищу качественные ответы, но любые количественные или формальные ответы также приветствуются. Я особенно хотел бы видеть любые визуальные представления, которые делают это более ясным.

naught101
источник
Вы можете быть немного яснее? Среднее арифметическое и медиана - это функции, которые мы применяем к данным, а не что-то присущее конкретным распределениям ... например, данные не должны быть нормальными, чтобы вы могли рассчитать среднее по выборке.
Гость
Итак, вопрос должен быть технически следующим: «Как ожидаемое значение соотносится со средним, медианой и т. Д. Данных, взятых случайным образом из определенного распределения вероятностей?» Я ищу простое, интуитивное понимание, аналогичное тому, как вы можете интуитивно сказать, что когда распределение более искажено, медиана и среднее значение находятся дальше друг от друга, и медиана может дать лучшее представление о том, где находятся данные.
naught101
Хех. Спасибо Марко. Я явно неправильно читал. Можно также написать, что в качестве ответа я выберу его в лучшем ответе.
naught101

Ответы:

8

(частично преобразовано из моего ныне удаленного комментария выше)

Ожидаемое значение и среднее арифметическое - это одно и то же. Медиана связана со средним нетривиальным образом, но вы можете сказать несколько вещей об их отношении:

  • когда распределение симметрично, среднее значение и медиана одинаковы

  • когда распределение отрицательно искажено, медиана обычно больше, чем среднее

  • когда распределение положительно искажено, медиана обычно меньше среднего

макрос
источник
Интересно. Какие есть примеры необычного поведения отрицательно искаженного распределения, где среднее больше, чем медиана?
naught101
@ naught101: это опечатка? Отрицательно искаженное распределение - это распределение, при котором исходы слева от центра встречаются чаще, чем исходы справа от центра, и поэтому «хвост» низкочастотных исходов выходит вправо. В такой ситуации горб слева всегда будет тянуть (арифметическое) среднее значение слева от центра, в то время как хвост справа будет держать медиану больше среднего.
Асад Эбрахим
@AssadEbrahim: Нет, это была ссылка на комментарий Макроса «медиана обычно больше, чем среднее» - я просил контрпримеры.
naught101
@ naught101: контрпримеры в случае унимодального распределения - его следующая строка: когда горб находится справа, то хвост слева тянет медиану ниже среднего. Чем длиннее хвост, тем больше разрыв между средним и средним.
Асад Эбрахим
1
Каковы практические обстоятельства, при которых можно было бы использовать медиану над средним или наоборот? Например, при анализе выживаемости, когда время жизни соответствует экспоненциальному распределению, следует ли мне использовать медиану (таким образом, половина времени дольше, половина меньше) или среднее значение («ожидаемое» время жизни), если мне нужно было предсказать жизнь / смерть в виде двоичного числа результат?
Древико
5

Между гармоникой, геометрическим и средним арифметическим логарифмически нормально распределенной случайной величины существует хорошая связь . ПозволятьИкс~LN(μ,σ2)

  • (среднее гармоническое),ЧАСM(Икс)знак равноеμ-12σ2
  • (среднее геометрическое),гM(Икс)знак равноеμ
  • (среднее арифметическое).AM(Икс)знак равноеμ+12σ2

Нетрудно видеть, что произведение гармонического и среднего арифметического дает квадрат среднего геометрического, т.е.

ЧАСM(Икс)AM(Икс)знак равногM2(Икс),

ИксИксИкс

гM(Икс)знак равноЧАСM(Икс)AM(Икс),

Кроме того, хорошо известное неравенство HM-GM-AM

ЧАСM(Икс)гM(Икс)AM(Икс)

можно выразить как

ЧАСM(Икс)гВaр(Икс)знак равногM(Икс)знак равноAM(Икс)гВaр(Икс),

гВaр(Икс)знак равноеσ2

Бьорн Фридрих
источник
1

Для полноты существуют также распределения, для которых среднее значение не является четко определенным. Классическим примером является распределение Коши (у этого ответа есть хорошее объяснение почему). Другим важным примером является распределение Парето с показателем степени меньше 2.

drevicko
источник
1
Иксзнак равно0
@Carl хорошие моменты - я отредактировал ответ соответственно. Многие спасибо (:
Drevicko
0

В то время как правильно, что математически среднее значение и ожидаемое значение определяются одинаково, для искаженного распределения это соглашение об именах вводит в заблуждение.

Представьте, что вы спрашиваете подругу о ценах на жилье в ее городе, потому что вам там очень нравится, и вы действительно думаете о переезде в этот город.

Если распределение призов за жилье было унимодальным и симметричным, то ваш друг может сказать вам среднюю цену домов, и вы действительно можете ожидать, что большинство домов на рынке найдут эти средние значения.

Однако если распределение цен на жилье является унимодальным и искаженным, например, с перекосом вправо для большинства домов в нижнем ценовом диапазоне слева и только для некоторых непомерных домов справа, то среднее значение будет «перекошено» к высоким ценам на право.

При таком унимодальном, искаженном распределении цен на жилье вы можете ожидать, что большинство домов будет продаваться на рынке около медианы .

Сол Хатор
источник
1
Непонятно, что вы имеете в виду, когда говорите, что для искаженных унимодальных распределений цены на жилье имеют цены около медианы. Можно сказать, что половина значений будет на уровне или ниже медианы, а половина на уровне или выше медианы. Это не указывает, насколько близки эти значения к среднему.
Майкл Р. Черник
Я так понимаю, что ваше последнее предложение должно заканчиваться словом "медиана"? Если это так, я думаю, очевидно, что медиана должна быть (достижимой) величиной, ближайшей к средней (которая может быть недостижимой, например, не цена на жилье) случайной выборки, взятой из популяции, описанной выше. То есть медиана в среднем ближе всего к этой средней выборке. Если нет, я бы не стал утверждать, насколько эти значения близки к среднему. Я сделал заявление об их расстоянии до медианы.
Сол Хатор