Дисперсия функции одной случайной величины

33

Допустим, у нас есть случайная величина с известной дисперсией и средним значением. Вопрос в том, какова дисперсия f ( X ) для некоторой заданной функции f. Единственный общий метод, который мне известен, - это дельта-метод, но он дает только приблизительное значение. Теперь меня интересует f ( x ) = Иксе(Икс)е(Икс)знак равноИкс , но было бы также неплохо узнать некоторые общие методы.

Редактировать 29.12.2010
Я провел некоторые расчеты с использованием рядов Тейлора, но я не уверен, верны ли они, поэтому я был бы рад, если бы кто-то смог их подтвердить .

Сначала нам нужно приблизить Е[е(Икс)]
Е[е(Икс)]Е[е(μ)+е'(μ)(Икс-μ)+12е"(μ)(Икс-μ)2]знак равное(μ)+12е"(μ)Вaр[Икс]

Теперь мы можем приблизить E [(f (X) -E [f (X)]) ^ 2] \ приблизительное E [(f (\ mu) + f '(\ mu) ( X- \ mu) + \ frac {1} {2} \ cdot f '' (\ mu) (X- \ mu) ^ 2 -E [f (X)]) ^ 2]E [ ( f ( X ) - E [ f ( X ) ] ) 2 ] E [ ( f ( μ ) + f ( μ ) ( X - μ ) + 1D2[е(Икс)]
Е[(е(Икс)-Е[е(Икс)])2]Е[(е(μ)+е'(μ)(Икс-μ)+12е"(μ)(Икс-μ)2-Е[е(Икс)])2]

Используя приближение Е[е(Икс)] мы знаем, что f(μ)Ef(x)12f(μ)Var[Икс]

Используя это, мы получаем:
D2[f(X)]14f(μ)2Var[X]212f(μ)2Var[X]2+f(μ)2Var[X]+14f(μ)2E[(Xμ)4]+12f(μ)f(μ)E[(Xμ)3]
D2[f(X)]14f(μ)2[D4X(D2X)2]+f(μ)D2X+12f(μ)f(μ)D3X

Томек Тарчинский
источник
Дельта-метод используется для асимптотических распределений. Вы не можете использовать, когда у вас есть только одна случайная величина.
mpiktas
@mpiktas: На самом деле я мало что знаю о методе Дельта, я только что прочитал кое-что в Википедии. Это цитата из вики: «Дельта-метод использует разложения Тейлора второго порядка для аппроксимации дисперсии функции одной или нескольких случайных величин».
Томек Тарчински
кажется, что в Википедии есть именно то, что вы хотите: en.wikipedia.org/wiki/… . Я пересмотрю свой ответ, кажется, что я недооценил расширение Тейлора.
mpiktas
Томек, если вы не согласны с изменениями, которые были сделаны (не мной), вы всегда можете изменить их снова или откатить назад, или просто указать на различия и попросить разъяснений.
Glen_b
2
@Glen_b: я согласен с ними E (X-mu) = 0 не означает, что E [(X-mu) ^ 3] = 0.
Томек Тарчински

Ответы:

33

Обновить

Я недооценил расширения Тейлора. Они на самом деле работают. Я предположил, что интеграл от остаточного члена может быть неограниченным, но, немного поработав, можно показать, что это не так.

Разложение Тейлора работает для функций в ограниченном замкнутом интервале. Для случайных величин с конечной дисперсией неравенство Чебышева дает

п(|Икс-ЕИкс|>с)Вaр(Икс)с

Таким образом, для любого мы можем найти достаточно большой с, чтобыε>0с

п(Икс[ЕИкс-с,ЕИкс+с])знак равноп(|Икс-ЕИкс|с)<1-ε

Сначала оценим . Имеем E f ( X ) = | х - Е X | C F ( х ) д Р ( х ) + | х - Е X | > c f ( x ) d F ( x ), где F ( x ) - функция распределения дляЕе(Икс)

Ef(X)=|xEX|cf(x)dF(x)+|xEX|>cf(x)dF(x)
F(x) .X

Поскольку областью первого интеграла является интервал который является ограниченным замкнутым интервалом, мы можем применить разложение Тейлора: f ( x ) = f ( E X ) + f ( E X ) ( x - E X ) + f ( E X )[EXc,EX+c] гдеα[EX-c,EX+c], и равенство выполняется для всехx[EX-c,EX+c]. Я взял только 4 члена в разложении Тейлора, но в общем случае мы можем взять столько, сколько захотим, при условии, что функцияfдостаточно гладкая.

f(x)=f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(α)3(xEX)3
α[EXc,EX+c]x[EXc,EX+c]f

Подставляя эту формулу в предыдущую, получим

Ef(X)=|xEX|cf(EX)+f(EX)(xEX)+f(EX)2(xEX)2dF(x)+|xEX|cf(α)3(xEX)3dF(x)+|xEX|>cf(x)dF(x)

Ef(X)=f(EX)+f(EX)2E(XEX)2+R3
R3=f(α)3E(XEX)3++|xEX|>c(f(EX)+f(EX)(xEX)+f(EX)2(xEX)2+f(X))dF(x)
Now under some moment conditions we can show that the second term of this remainder term is as large as P(|XEX|>c) which is small. Unfortunately the first term remains and so the quality of the approximation depends on E(XEX)3 and the behaviour of third derivative of f in bounded intervals. Such approximation should work best for random variables with E(XEX)3=0.

Now for the variance we can use Taylor approximation for f(x), subtract the formula for Ef(x) and square the difference. Then

E(f(x)Ef(x))2=(f(EX))2Var(X)+T3

where T3 involves moments E(XEX)k for k=4,5,6. We can arrive at this formula also by using only first-order Taylor expansion, i.e. using only the first and second derivatives. The error term would be similar.

Other way is to expand f2(x):

f2(x)=f2(EX)+2f(EX)f(EX)(xEX)+[(f(EX))2+f(EX)f(EX)](XEX)2+(f2(β))3(XEX)3

Similarly we get then

Ef2(x)=f2(EX)+[(f(EX))2+f(EX)f(EX)]Var(X)+R~3
where R~3 is similar to R3.

Формула для дисперсии становится

Вaр(е(Икс))знак равно[е'(ЕИкс)]2Вaр(Икс)-[е"(ЕИкс)]24Вaр2(Икс)+T~3
где T~3 есть только третьи моменты и выше.
mpiktas
источник
Мне не нужно знать точное значение дисперсии, приближение должно работать для меня.
Томек Тарчински
Действительно, приближенная формула для Е[е(Икс)] в ОП часто используется при анализе рисков в экономике, финансах и страховании.
Раскольников
@Raskolnikov, да, но это противоречит моим восхитительно устаревшим знаниям о расширении Тейлора. Ясно, что оставшийся срок должен быть принят во внимание. Если случайная величина ограничена, то проблем нет, поскольку многочлены приближают непрерывные функции на ограниченном интервале равномерно. Но мы имеем дело с неограниченными случайными величинами. Конечно, для случайной нормали можно сказать, что она эффективно ограничена, но все же в общем случае могут возникнуть некоторые неприятные сюрпризы, или нет. Я исправлю свой ответ, когда у меня будет четкий ответ.
mpiktas
2
@ Томек Тарчинский, третья производная от Икс идет к нулю довольно быстро для больших Икс, но неограничен вблизи нуля. Таким образом, если вы выбрали равномерное распределение с поддержкой, близкой к нулю, оставшийся член может стать большим.
mpiktas
1
Обратите внимание, что в вашей ссылке равенство является приблизительным. В этом ответе все уравнения точны. Кроме того, для отклонения отметим, что первая производная оценивается наЕИксне Икс, Кроме того, я никогда не говорил, что это не будет работать дляИкс, только что для Икс приблизительная формула может иметь огромную ошибку, если Икс Домен близок к нулю.
mpiktas
8

Знать первые два момента X (среднее значение и дисперсию) недостаточно, если функция f (x) произвольна (нелинейна). Не только для вычисления дисперсии преобразованной переменной Y, но и для ее среднего. Чтобы увидеть это - и, возможно, атаковать вашу проблему - вы можете предположить, что ваша функция преобразования имеет расширение Тейлора вокруг среднего значения X и работает оттуда.

леонблой
источник