Линейное преобразование случайной величины с помощью высокой прямоугольной матрицы

12

Допустим, у нас есть случайный вектор , взятый из распределения с функцией плотности вероятности . Если мы линейно преобразуем его с помощью матрицы полного ранга, чтобы получить , то плотность определяется какеХ (х )п×пY =X Y FY (Y )=1XRnfX(x)n×nAY=AXY

fY(y)=1|detA|fX(A1y).

Теперь предположим, что мы преобразуем X вместо этого в m×n матрицы B , с m>n , что дает Z=BX . Ясно, что ZRm , но он "живет" в n мерном подпространстве GRm . Какова условная плотность Z , если мы знаем, что она лежит в G ?

Мой первый инстинкт должен был использовать псевдо-инверсию B . Если B=USVT представляет собой разложение по сингулярным значение B , то B+=VS+UT является псевдообратная, где S+ образуется инвертированием ненулевых элементов диагональной матрицы S . Я догадывался, что это даст

fZ(z)=1|det+S|fX(B+z),
где под det+S я подразумеваю произведение ненулевых сингулярных значений.

Это рассуждение согласуется с плотностью для единственной нормали (обусловленной знанием того, что переменная живет в соответствующем подпространстве), приведенной здесь и упомянутой также здесь и в этой публикации CrossValidated .

Но это не правильно! Константа нормализации выключена. (Тривиальный) контрпример дается при рассмотрении следующего случая: С XN(0,1) , пусть

Y=(11)X=(XX).
Здесь матрица B сверху является только вектором. Его псевдообратная последовательность:
B+=(1/21/2)
и det+B=2 . Вышеизложенное объясняет, что f_ \ vec {Y} (\ vec {y}) = \ frac {1} {\ sqrt {2 \ pi} \ sqrt {2}} \ exp \ left (- \ frac {1} {2} \ vec {y} ^ T (B ^ +) ^ TB ^ + \ vec {y} \ right),
fY(y)=12π2exp(12yT(B+)TB+y),
но на самом деле это объединяет (на линии y=x ) в 12, Я понимаю, что в этом случае вы могли бы просто удалить одну из записей Y что вы сделали, но когда B намного больше, идентификация набора записей для удаления раздражает. Почему не работает псевдообратное мышление? Существует ли общая формула для функции плотности линейного преобразования множества случайных величин с помощью «высокой» матрицы? Любые ссылки будут с благодарностью.
Дэн
источник

Ответы:

2

Для тех, кто может столкнуться с этим в будущем ... источник ошибки фактически связан с интеграцией. В приведенном выше примере интегрирование происходит по линии . Поэтому необходимо «параметризовать» линию и учитывать якобиан параметризации при взятии интеграла, поскольку каждый единичный шаг в оси соответствует шагам длины на прямой. Параметризация, которую я неявно использовал, была дана , другими словами, определяя обе одинаковые записи в по значению. Это Якобиан , который аккуратно отменяется с помощьюх y=xx x(x,x)y2x(x,x)y22 (происходит от точно такого же якобиана) в знаменателе.

Пример был искусственно прост - для общего преобразования можно иметь другую параметризацию для вывода, которая является естественной в контексте проблемы. Поскольку параметризация должна охватывать то же подпространство что и , и это подпространство является гиперплоскостью, параметризация сама по себе, вероятно, будет линейной. Вызывая матричное представление параметризации , требуется просто, чтобы он имел то же пространство столбцов, что и (покрывал одну и ту же гиперплоскость). Тогда конечная плотность становитсяG B m × n L B f Z ( z ) = | дет + л |BGBm×nLB

fZ(z)=|det+L||det+B|fX(B+z).

В общем, эта установка довольно странная, и я думаю, что правильнее всего сделать, это найти максимальный линейно независимый набор строк и удалить остальные строки (вместе с соответствующими компонентами преобразованной переменной ) , чтобы получить квадратную матрицу . Тогда задача сводится к случаю полного ранга (при условии, что имеет полный ранг столбца).Z В п × п ВBzB^n×nB

Дэн
источник