Является ли ожидание таким же, как среднее?

Я делаю ML в моем университете, и профессор упомянул термин «ожидание» (E), в то время как он пытался объяснить нам некоторые вещи о гауссовских процессах. Но по тому, как он это объяснил, я понял, что E - это то же самое, что и среднее значение μ. Я правильно понял?

Если это то же самое, то знаете ли вы, почему используются оба символа? Также я увидел, что E можно использовать как функцию, например, E ( ), но я не видел этого для μ. $x^2$

Может ли кто-нибудь помочь мне лучше понять разницу между ними?

machine-learning gaussian-process linear-algebra Джим блум
источник

Для непрерывного

, где

является функцией плотности вероятности. Так что это верно только тогда, когда

является аргументом. Однако это также может быть правдой, если мы имеем

, где

X

$X$

E [X] = \int_{- \infty}^{\infty} f (x) x d x = μ (x)

$E[X] = \int_{-\infty}^{\infty} f(x)x dx = \mu(x)$

f (x)

$f(x)$

X

$X$

E [g (X)] = E [X] = μ (X)

$E[g(X)] = E[X] = \mu(X)$

- это нечто иное, чем функция тождества.

g

$g$

Jase

@ Джейс

? Почему правая часть является функцией от

, которая должна была исчезнуть после замены пределов при оценке интеграла?

μ (x)

$\mu(x)$

x

$x$

Дилип Сарвэйт

@DilipSarwate

была опечаткой. Имею ввиду, чтобы сказать

μ (x)

$\mu(x)$

μ = μ (X)

$\mu = \mu(X)$

Jase

Джон: на вашем месте я бы изучал базовую вероятность, прежде чем посещать занятия по машинному обучению / гауссовским процессам. Взгляните на эту книгу: math.uiuc.edu/~r-ash/BPT.html

Zen

Большое спасибо, ребята, за вашу помощь! Я не ожидал так много отзывов. @Zen Большое спасибо за ваш совет. Я абсолютно согласен с вами. Я взял модуль в качестве старшекурсника по вероятностям и статистике. Однако у нас просто было простое введение в распределения и вероятности, и, к сожалению, мы не сделали их подробно. Кроме того, мы не упомянули термин «ожидание». Сейчас я пытаюсь самостоятельно покрыть свои пробелы в статистике и вероятностях.

Джим Блюм

Ответы:

Ожидаемое / ожидаемое значение - это оператор, который можно применить к случайной переменной. Для дискретных случайных величин (например , биномиальное) с возможных значений она определяется как . То есть это среднее из возможных значений, взвешенных по вероятности этих значений. Непрерывные случайные величины можно рассматривать как обобщение этого: . Среднее значение случайной величины является синонимом ожидания. $k$ $\sum_i^k x_i p(x_i)$ $\int x dP$

Гауссово (нормальное) распределение имеет два параметра и . Если нормально распределен, то . Таким образом, среднее значение гауссовской распределенной переменной равно параметру Это не всегда так. Возьмем биномиальное распределение, которое имеет параметры и . Если биномиально распределено, то . $\mu$ $\sigma^2$ $X$ $E(X)=\mu$ $\mu$ $n$ $p$ $X$ $E(X)=np$

Как вы видели, вы также можете применить ожидание к функциям случайных величин, так что для гауссова вы можете найти, что . $X$ $E(X^2)=\sigma^2+\mu^2$

Страница Википедии об ожидаемых значениях довольно информативна: http://en.wikipedia.org/wiki/Expected_value

Джереми Койл
источник

«... так что для гауссовского

вы можете найти, что

». Абсолютно необходимо, чтобы

по Гауссу для этого отношения сохранялось?

X

$X$

E (X^{2}) = σ^{2} + μ^{2}

$E(X^2)=\sigma^2+\mu^2$

X

$X$

Дилип Сарвэйт

Отношение

всегда будет выполняться, но я ожидаю, что ответ будет записан в терминах параметров распределения. Поэтому, если бы я спросил кого-то, что

было для распределенного бинома

, я бы ожидал ответа

, а не

E (X^{2}) = V (X) + E (X)^{2}

$E(X^2)=V(X)+E(X)^2$

E (X^{2})

$E(X^2)$

X

$X$

(n, p)

$(n,p)$

n p (1 - p) + (n p)^{2}

$np(1-p)+(np)^2$

σ^{2} + μ^{2}

$\sigma^2+\mu^2$

Джереми Койл

Но если бы вы спросили, что такое

для биномиальной случайной величины со средним значением

и дисперсией

, ответ будет

. Конечно, биномиальные случайные величины обычно параметризуются с использованием

, но что с того? Из среднего значения и дисперсии мы можем легко найти

E (X^{2})

$E(X^2)$

μ

$\mu$

σ^{2}

$\sigma^2$

σ^{2} + μ^{2}

$\sigma^2+\mu^2$

n

$n$

p

$p$

п знак равно 1 - \frac{дисперсия}{жадный}

$p = 1 - \frac{\text{variance}}{\text{mean}}$

N знак равно \frac{жадный}{п} знак равно \frac{{жадный}^{2}}{жадный - дисперсия},

$n = \frac{\text{mean}}{p} = \frac{\text{mean}^2}{\text{mean}-\text{variance}}.$

Дилип Сарвейт

Весь смысл примера состоял в том, чтобы провести различие между параметрами распределения и моментами распределения. Да, можно перепараметризовать распределения с точки зрения их моментов, но, поскольку OP спрашивал о взаимосвязи между

, кажется важным продолжать проводить это различие. Есть ли причина, по которой вы решили быть педантичным в этом вопросе?

E (X)

$E(X)$

μ

$\mu$

Джереми Койл

Большое спасибо, Джереми! Отличный ответ. Вы были очень полезны!

Джим Блум

Ожидание с операторской нотацией E () (найдены различные предпочтения хороших шрифтов, римского или курсивного, простого или причудливого) подразумевает принятие среднего значения его аргумента, но в математическом или теоретическом контексте. Термин восходит к Христиану Гюйгенсу в 17 веке. Идея очевидна в большей части теории вероятностей и математической статистики, и, например, книга Питера Уиттла « Вероятность через ожидание» ясно показывает, как ее можно сделать еще более центральной.

По сути, это просто вопрос соглашения, что средние (средние) также часто выражаются довольно по-разному, в частности, единичными символами, особенно когда эти средние значения рассчитываются на основе данных. Тем не менее, Уиттл в только что приведенной книге использует обозначение A () для усреднения, а угловые скобки вокруг переменных или выражений, подлежащих усреднению, широко распространены в физической науке.

Ник Кокс
источник