Каково распределение , где - равномерные распределения?

17

У меня есть четыре независимые равномерно распределенные переменные , каждая в . Я хочу рассчитать распределение . Я вычислил распределение как (отсюда ) и должно быть f_1 (u_1) = \ frac {1- \ sqrt {u_1}} {\ sqrt {u_1}}. Теперь распределение суммы u_1 + u_2 равно ( u_1, \, u_2 также независимый) f_ {u_1 + u_2} (x) = \ int _ {- \ infty} ^ {+ \ infty} f_1 (xy) f_2 (y) dy = - \ frac {1} {4} \ int_0 ^ 4 \ frac {1- \ sqrt {xy}} {\ sqrt {xy}} \ cdot \ ln \ frac {y} {4} dy, потому что y \ in (0,4]a,b,c,d[0,1](ad)2+4bcu2=4bc

f2(u2)=14lnu24
u2(0,4]u1=(ad)2
f1(u1)=1u1u1.
u1+u2f u 1 + u 2 ( x ) = + - f 1 ( x - y ) f 2 ( y ) d y = - 1u1,u2y(0,4]
fu1+u2(x)=+f1(xy)f2(y)dy=14041xyxylny4dy,
y(0,4], Здесь должно быть поэтому интеграл равен f_ {u_1 + u_2} (x) = - \ frac {1} {4} \ int_0 ^ {x} \ frac {1- \ sqrt {xy} } {\ SQRT {ху}} \ CD \ пер \ гидроразрыва {у} {-} ау. Теперь я вставляю его в Mathematica и получаю, что f_ {u_1 + u_2} (x) = \ frac {1} {4} \ left [-x + x \ ln \ frac {x} {4} -2 \ sqrt {x } \ left (-2+ \ ln x \ right) \ right].x>yfu1+u2(x)=1
fu1+u2(x)=140x1xyxylny4dy.
fu1+u2(x)=14[x+xlnx42x(2+lnx)].

Я сделал четыре независимых набора a,b,c,d состоящих из 106 чисел каждый, и нарисовал гистограмму (ad)2+4bc :

введите описание изображения здесь

и нарисовал график fu1+u2(x) :

введите описание изображения здесь

Как правило, график похож на гистограмму, но на интервале (0,5) большая его часть отрицательна (корень находится на уровне 2,27034). И интеграл положительной части составляет 0.77 .

Где ошибка? Или где я что-то упустил?

РЕДАКТИРОВАТЬ: я масштабировал гистограмму, чтобы показать PDF.

введите описание изображения здесь

РЕДАКТИРОВАТЬ 2: Я думаю, что я знаю, где проблема в моих рассуждениях - в пределах интеграции. Поскольку и , я не могу просто . На графике показана область, в которую я должен интегрироваться:x - y ( 0 , 1 ] x 0y(0,4]xy(0,1]0x

введите описание изображения здесь

Это означает, что у меня есть для (поэтому часть моего была правильной), в и в . К сожалению, Mathematica не может вычислить последние два интеграла (ну, он действительно вычисляет второй, поскольку в выводе есть мнимая единица, которая все портит ... ). y ( 0 , 1 ] f x x - 1 y ( 1 , 4 ] 4 x - 1 y ( 4 , 5 ]0xy(0,1]fx1xy(1,4]x14y(4,5]

РЕДАКТИРОВАТЬ 3: Похоже, что Mathematica МОЖЕТ вычислить последние три интеграла с помощью следующего кода:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

который дает правильный ответ :)

corey979
источник
2
Мне нравится, что вы пытались проверить обоснованность своего ответа с помощью симуляции. Ваша проблема в том, что вы знаете , что сделали ошибку, но не видите, где именно. Рассматривали ли вы, что вы можете проверить каждую стадию вашего метода, чтобы найти причину ошибки? Например, ошибка лежит в вашем ? Что ж, вы можете проверить свой расчетный PDF по смоделированным результатам так же, как вы сделали для вашего окончательного ответа. То же самое для . Если и оба верны, то вы сделали ошибку при их объединении. Такая пошаговая проверка позволяет вам точно определить, где вы ошиблись! f1(u1)f2f1f2
Серебряная рыбка
Я выбросил свою первую попытку и пересчитал ее с нуля. Я считаю, что и верны, хотя мне пришлось вручную умножить мой начальный на 2, чтобы нормализовать его до единицы. Но это только меняет высоту и не объясняет, почему у меня отрицательный . f1f2f1f
corey979
При создании таких гистограмм для сравнения с вычисленными алгебраическими величинами масштабируйте гистограмму до допустимой плотности (и накладывайте их, если можете). Сделайте аналогичную проверку для ваших f1 и f2, чтобы убедиться, что у вас есть те права; если они правы (я пока не вижу веских оснований подозревать их, но лучше перепроверить), тогда проблема должна быть позже.
Glen_b

Ответы:

19

Часто это помогает использовать кумулятивные функции распределения.

Первый,

F(x)=Pr((ad)2x)=Pr(|ad|x)=1(1x)2=2xx.

Следующий,

G(y)=Pr(4bcy)=Pr(bcy4)=0y/4dt+y/41ydt4t=y4(1log(y4)).

Пусть между наименьшим ( ) и наибольшим ( ) возможными значениями . Запись с CDF и с PDF , нам нужно вычислитьδ05(ad)2+4bcx=(ad)2Fy=4bcg=G

H(δ)=Pr((ad)2+4bcδ)=Pr(xδy)=04F(δy)g(y)dy.

Мы можем ожидать, что это будет неприятно - равномерное распределение PDF является прерывистым и, следовательно, должно приводить к разрывам в определении поэтому удивительно, что Mathematica получает закрытую форму (которую я не буду здесь воспроизводить). Дифференцирование его по отношению к дает желаемую плотность. Он определяется кусочно в течение трех интервалов. В ,Hδ0<δ<1

H(δ)=h(δ)=18(8δ+δ((2+log(16)))+2(δ2δ)log(δ)).

В ,1<δ<4

h(δ)=14((δ+1)log(δ1)+δlog(δ)4δcoth1(δ)+3+log(4)).

А в ,4<δ<5

h(δ)=14(δ4δ4+(δ+1)log(4δ1)+4δtanh1((δ4)δδδδ4)1).

фигура

Эта фигура перекрывает график на гистограмме из iid реализаций . Они почти неразличимы, что свидетельствует о правильности формулы для .h106(ad)2+4bch


Следующее - почти бессмысленное решение Mathematica с грубой силой . Это автоматизирует практически все в расчете. Например, он даже вычислит диапазон результирующей переменной:

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

Здесь все интеграции и дифференциации. (Будьте терпеливы; вычисление занимает пару минут.)H

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

Наконец, симуляция и сравнение с графиком :h

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]
Whuber
источник
8
(+1), особенно для напоминания людям, что вместо того, чтобы говорить о свертках плотности, «часто это помогает использовать кумулятивные функции распределения», особенно когда они имеют такую ​​простую форму, как здесь. И ты тоже был чертовски быстр.
Алекос Пападопулос
F(Икс)грамм(Y)FграммЧАС
Fграмм
7

Как и OP и Whuber, я бы использовал независимость, чтобы разбить это на более простые проблемы:

Иксзнак равно(a-d)2Иксе(Икс)

введите описание изображения здесь

Yзнак равно4бсYграмм(Y)

введите описание изображения здесь

X+YTransformSum

TransformSum[{f,g}, z]

Z=X+Y

введите описание изображения здесь

h(z)

введите описание изображения здесь

Быстрая проверка Монте-Карло

Следующая диаграмма сравнивает эмпирическое приближение pdf (волнистый синий) с точки зрения Монте-Карло с теоретическим pdf, полученным выше (красная пунктирная линия). Выглядит хорошо.

введите описание изображения здесь

wolfies
источник