Как работает формула для генерации коррелированных случайных величин?

19

Если у нас есть 2 нормальные некоррелированные случайные величины то мы можем создать 2 коррелированные случайные величины с формулойX1,X2

Y=ρX1+1ρ2X2

и тогда у будет корреляция с .ρ X 1YρX1

Может кто-нибудь объяснить, откуда взялась эта формула?

Lanza
источник
1
Подробное обсуждение этого и связанных с ним вопросов содержится в моем ответе по адресу stats.stackexchange.com/a/71303 . Среди прочего, ясно, что (1) предположение о нормальности не имеет значения и (2) вам необходимо сделать дополнительные предположения: дисперсии и должны быть равными, чтобы корреляция с была . X 2 Y X 1 ρX1X2YX1ρ
whuber
Очень интересная ссылка. Я не уверен, что понимаю, что вы подразумеваете под нормальностью, что не имеет значения. Если или не является нормальным, и становится сложнее контролировать плотность помощью алгоритма Кайзера-Дикмана. В этом вся причина того, что специализированные алгоритмы генерируют ненормальные коррелированные данные (например, Headrick, 2002; Ruscio & Kaczetow, 2008; Vale & Maurelli, 1983). Например, представьте, что ваша цель состоит в том, чтобы генерировать ~ normal, ~iform с = .5. Используя ~ однородные результаты в , который не является равномерным ( заканчивает тем , что линейная комбинация нормальной и равномерной). X 2 Y X Y ρ X 2 Y YX1X2YXYρX2YY
Энтони
@Anthony Вопрос только о корреляции , которая является функцией только первого и второго моментов. Ответ не зависит от каких-либо других свойств распределений. То, что вы обсуждаете, это совсем другая тема.
whuber

Ответы:

17

Предположим, вы хотите найти линейную комбинацию и такую, чтоX 2X1X2

corr(αX1+βX2,X1)=ρ

Обратите внимание, что если вы умножите и и на одну и ту же (ненулевую) константу, корреляция не изменится. Таким образом, мы собираемся добавить условие для сохранения дисперсии:β var ( α X 1 + β X 2 ) = var ( X 1 )αβvar(αX1+βX2)=var(X1)

Это эквивалентно

ρзнак равносОУ(αИкс1+βИкс2,Икс1)вар(αИкс1+βИкс2)вар(Икс1)знак равноαсОУ(Икс1,Икс1)знак равновар(Икс1)+βсОУ(Икс2,Икс1)знак равно0вар(αИкс1+βИкс2)вар(Икс1)знак равноαвар(Икс1)α2вар(Икс1)+β2вар(Икс2)

Предполагая, что обе случайные величины имеют одинаковую дисперсию (это принципиальное предположение!) ( ), мы получаемвар(Икс1)знак равновар(Икс2)

ρα2+β2знак равноα

Существует много решений для этого уравнения, поэтому пришло время вспомнить условие сохранения дисперсии:

var(Икс1)знак равновар(αИкс1+βИкс2)знак равноα2вар(Икс1)+β2вар(Икс2)α2+β2знак равно1

И это приводит нас к

αзнак равноρβзнак равно±1-ρ2

UPD . Что касается второго вопроса: да, это известно как отбеливание .

Артем Соболев
источник
9

Уравнение представляет собой упрощенную двумерную форму разложения Холецкого . Это упрощенное уравнение иногда называют алгоритмом Кайзера-Дикмана (Kaiser & Dickman, 1962).

Обратите внимание, что и должны иметь одинаковую дисперсию, чтобы этот алгоритм работал правильно. Кроме того, алгоритм обычно используется с обычными переменными. Если или не являются нормальными, может не иметь той же формы распределения, что и .X 2 X 1 X 2 Y X 2X1X2X1X2YX2

Ссылки:

Kaiser, HF, & Dickman, K. (1962). Матрица выборки и оценки популяции и выборочные матрицы корреляции из произвольной матрицы корреляции населения. Психометрика, 27 (2), 179-182.

Энтони
источник
2
Я полагаю, вам не нужны стандартизированные нормальные переменные, достаточно иметь одну и ту же дисперсию.
Артем Соболев
2
Нет, распределение является не смесь распределения , как вы утверждаете. Y
Дилип Сарвате
Точка занята, @Dilip Sarwate. Если или ненормальны, то становится линейной комбинацией двух переменных, которая может не привести к желаемому распределению. Это является причиной специализированных алгоритмов (вместо Кайзера-Дикмана) для генерируемых ненормальных коррелированных данных. X 2 YИкс1Икс2Y
Энтони
3

Коэффициент корреляции - это между двумя рядами, если они рассматриваются как векторы (с точкой данных, равной измерению вектора). Приведенная выше формула просто создает разложение вектора на его компоненты , (относительно ). если , то .n t h n t h cos θ s i n θ X 1 , X 2 ρ = c o s θ созNTчасNTчассозθsяNθИкс1,Икс2
ρзнак равносоsθ1-ρ2знак равно±sяNθ

Поскольку, если не коррелированы, угол между ними является прямым углом (т. Е. Они могут рассматриваться как ортогональные, хотя и ненормализованные базисные векторы).Икс1,Икс2

Дмитрий Рубанович
источник
2
Добро пожаловать на наш сайт! Я полагаю, что вашему посту будет уделено больше внимания, если вы пометите математические выражения с помощью : заключите их в знаки доллара. При редактировании доступна помощь. TЕИкс
whuber