Почему распределение rand () ^ 2 отличается от rand () * rand ()?

15

В Libre Office Calc rand()доступна функция, которая выбирает случайное значение от 0 до 1 из равномерного распределения. Я немного заржавел в своей вероятности, поэтому, когда я увидел следующее поведение, я был озадачен:

A = 200x1 столбец rand()^2

B = 200x1 столбец rand()*rand()

mean(A) знак равно 1/3

mean(B) знак равно 1/4

Почему mean(A)! = 1/4?

Jefftopia
источник
4
Потому что ожидание квадрата случайной величины не равно квадрату ее ожидания.
Майкл М
3
Если rand()работает как другие подобные операторы, то A - это то же самое случайное число в квадрате, а B - это два умноженных случайных числа.
Питер Флом - Восстановить Монику
Я понимаю. Было бы очень полезно, хотя, если бы я мог видеть математику, изложенную или связанную с ресурсом, который делает это.
Jefftopia
4
Упрощение ситуации может помочь вам понять суть. Предположим, Rand()были заменены Int(2*Rand()): это принимает значения и 1 с равными вероятностями. Есть две возможности для его квадрата и четыре возможности для произведения двух (независимых) значений: что происходит, когда вы определяете их ожидания? 01
whuber

Ответы:

24

Может быть полезно подумать о прямоугольниках. Представьте, что у вас есть шанс получить землю бесплатно. Размер земли будет определяться (а) одной реализацией случайной величины или (б) двумя реализациями одной и той же случайной величины. В первом случае (а) площадь будет квадратом с длиной стороны, равной выбранному значению. Во втором случае (b) два выбранных значения будут представлять ширину и длину прямоугольника. Какую альтернативу вы выбираете?

Пусть - реализация положительной случайной величины.U

а) Ожидаемое значение одной реализации определяет площадь квадрата, которая равна U 2 . В среднем размер области будет E [ U 2 ]UU2

E[U2]

б) Если есть две независимые реализации и U 2 , площадь будет U 1U 2 . В среднем размер равен E [ U 1U 2 ] = E 2 [ U ], поскольку обе реализации имеют одинаковое распределение и независимы.U1U2U1U2

E[U1U2]=E2[U]

Когда мы вычисляем разницу между размерами областей а) и б), мы получаем

E[U2]E2[U]

Var[U]0

Это верно для общего случая.

U(0,1)

E[U]=12
E2[U]=14
Var[U]=112

E[U2]=Var[U]+E2[U]

E[U2]=112+14=13

Эти значения были получены аналитически, но они совпадают с теми, которые вы получили с генератором случайных чисел.

Свен Хоэнштейн
источник
aba2+ab+b23
Это умное использование дисперсии. И вот тут я уже собирался навести математику напрямую.
Affine
Это имеет смысл для меня. Все зависит от того, что дисперсия неотрицательна. Мне также любопытно, как Джон получил свой ответ.
Джеффтопия
В основном просто следовал тому, что сделал Свен, но заменил их формулами для более общего равномерного распределения.
Джон
E[U2]E[U2]E[U2]E2[U]
10

Не для того, чтобы предположить, что в превосходном ответе Свена чего-то не хватает, но я хотел представить относительно элементарный взгляд на вопрос.

Рассмотрите возможность составления двух компонентов каждого продукта, чтобы увидеть, что совместное распределение сильно отличается.

сюжет u1 против u2 и u1 против u1

Обратите внимание, что продукт имеет тенденцию быть большим (около 1), когда оба компонента велики, что происходит гораздо легче, когда два компонента идеально коррелированы, а не независимы.

1ϵϵϵ/2U2U1×U2ϵ2/2

Большая разница!

Это может помочь нарисовать контуры изопродукта на графиках, подобных приведенным выше, то есть на кривых, где xy = константа для значений, таких как 0,5, 0,6, 0,7, 0,8, 0,9. При переходе к все большим и большим значениям доля точек выше и справа от контура уменьшается гораздо быстрее для независимого случая.

Glen_b - Восстановить Монику
источник