Ожидаемое значение в сравнении с наиболее вероятным значением (режим)

15

Ожидаемое значение распределения f(x) - это среднее значение, то есть средневзвешенное значение

E[x]=+xf(x)dx

Наиболее вероятным значением является режим, то есть наиболее вероятное значение.

Однако ожидаем ли мы как-нибудь увидеть E[x] много раз? Цитирую отсюда :

Если результаты не являются в равной степени вероятными, то простое среднее значение должно быть заменено средневзвешенным значением, которое учитывает тот факт, что некоторые результаты более вероятны, чем другие. Однако интуиция остается прежней: ожидаемое значение x - это то, что ожидается в среднем .xix

Я не могу понять, что означает «случается в среднем», означает ли это, что, для того, чтобы измерить много времени, я ожидаю увидеть больше, чем другие значения x ? Но разве это не определение режима?E[x]x

Так как же интерпретировать утверждение? И каков вероятностный смысл ?E[x]


Я также хотел бы показать пример, где я запутался. Изучение распределения я узнал , что режим является χ 2 м о д е = ν - 2 , в то время как E [ χ 2 ] = ν , где ν являются степенями свободы данных.χ2χmode2=ν2E[χ2]=νν

Я слышал в университете, что при проведении теста после использования метода наименьших квадратов для подбора набора данных я должен ожидать χ 2ν, потому что «это то, что происходит в общем».χ2χ2ν


Я неправильно понял все это или ожидаемое значение как-то очень вероятно? (Даже если наиболее вероятным значением является, конечно, режим)

Сорен
источник
4
Мне очень нравится сила метафоры « билеты в коробке» для этого вопроса, потому что она дает простой, ясный ответ: ожидание случайной величины - это сумма ее значений (как показано на билетах), деленная на количество билетов. Вот и все. Любое утверждение, которое не следует из этого определения (или его более сложных математических эквивалентов), является просто эвристическим и вполне может быть неверным в некоторых обстоятельствах.
whuber

Ответы:

18

Для нормального распределения ожидаемое значение, то есть среднее значение, равно моде.

В общем, ожидаемое значение не только не только не является наиболее вероятным (или при самой высокой плотности), но и может не иметь шансов на достижение. Например, рассмотрим случайную переменную X, которая равна 0 или 2, каждая с вероятностью 0,5. Тогда EX = 1, но ожидаемое значение 1 имеет вероятность 0, а 0 и 2 - оба режима распределения.

Цитата «ожидаемое значение x - это то, что ожидают в среднем» - это язык нетехнического непрофессионала, который, как видно из вашей путаницы, только запутывает вопросы. Ожидаемое значение имеет очень конкретное значение в вероятности, как математическое среднее. В то время как на языке неспециалистов ожидаемое значение или «в среднем» может быть чем-то, что обычно ожидается. Они могут быть согласованы, если «в среднем» интерпретируется как математическое среднее из того, что происходит.

Ожидаемо,

Джо Средний

Марк Л. Стоун
источник
1
Напрашивается вопрос: как насчет медианы, которая гарантированно возможна ?
яркая звезда
Как сказал @TrevorAlexander, режим также не дает гарантий. Рассмотрим режим непрерывного распределения.
Тим
3
@Trevor Alexander Всегда существует медиана, которая возможна (положительная вероятность или плотность). Однако не все медианы обязательно возможны. Медиана случайной величины X является любая точка т , для которых и Р ( Х м ) 1 / 2 . Если X равно 1,2,3 или 4, каждое с вероятностью 1/4, то любое число в интервале [2,3] является медианой X.P(Xm)1/2P(Xm)1/2
Марк Л. Стоун
5

Ожидаемое значение является априори очень абстрактным, и нет никаких оснований думать, что это наиболее вероятный результат; как указывают другие, легко построить случайные переменные, для которых (и то же самое с плотностью, если X непрерывно)

P(X=E(X))=0
X

Единственное оправдание ожидаемого значения и причина, по которой мы «ожидаем увидеть его часто», - это закон больших чисел :

если у вас есть независимых одинаково распределенных переменных X i , тоnXi

X1++XnnE(X)

p>1211p0

E(X)=1p+0(1p)=p

Теперь ясно, что «p» никогда не произойдет (это либо голова, либо хвост, либо 0, либо 1).

E(X)=p

Муравей
источник
Я бы не сказал, что закон больших чисел - единственное оправдание ожидаемого значения. Например, en.wikipedia.org/wiki/… является обоснованием для рассмотрения ожидаемых значений функций полезности (я не изучал доказательство, но я удивлен, если оно каким-то образом основано на законе больших чисел).
Юхо Коккала
3

Мне не нравится термин «ожидаемое значение», и я не использовал его при обучении вероятности. «Среднее арифметическое» лучше, на мой взгляд, потому что среднее арифметическое для 6-стороннего кристалла равно 3,5, но такого числа не бывает. Изначально я слышал термин «ценность ожидания» для концепции, когда учился в колледже. Многие технические термины не согласуются с очевидным нетехническим значением. («Или» приходит на ум.)

Обратите внимание, что распределение может иметь более одного режима, но среднее арифметическое уникально. Режим, среднее значение и медиана различны и используются по-разному.

TTW
источник
1
Хороший на "или". Это заставило меня задуматься о моем курсе по линейному программированию, в котором мы изучали несколько теорем об альтернативе. Они были в форме «Либо А верно, либо Б верно, но не оба». Гораздо проще выразить это как A xor B. Я не слышу много использования xor в повседневной уличной беседе.
Марк Л. Стоун
2

Разницу легче всего увидеть с помощью дискретных распределений:

Рассмотрим два набора значений, в которых одинаково вероятно нарисовать каждое число: {1,2,2,2,10} и {1,2,2,2,3}.

Оба имеют одинаковый режим (2), но ожидаемые значения отличаются. Ожидаемое значение придает дополнительный вес большим значениям, в то время как режим просто ищет, какое значение встречается часто. Таким образом, если вы извлекали из этого распределения несколько раз, среднее значение выборки было бы близко к ожидаемому значению, в то время как наиболее распространенное целое число было бы близко к режиму.

Режим определяется как моdезнак равноaрграммМаксимуме(Икс) в то время как вы показали выше, ожидаемое значение интегрируется по Икс*е(Икс) поэтому он считает вес каждого х.

Использование языка для различения различных показателей центральной тенденции является распространенной проблемой при изучении статистики. Например, медиана является еще одним показателем, который не искажается большими значениями, такими как среднее значение.

ВКГ
источник