Кто-то задал мне этот вопрос на собеседовании, и я ответил, что их совместное распространение всегда гауссовское. Я думал, что всегда могу написать двумерный гауссовский язык со своими средствами, дисперсией и ковариациями. Мне интересно, может ли быть случай, когда совместная вероятность двух гауссианов не является гауссовой?
91
Ответы:
Двустороннее нормальное распределение является исключением , а не правилом!
Важно признать, что «почти все» совместные распределения с нормальными маргиналами не являются двумерным нормальным распределением. То есть общая точка зрения, что совместные распределения с нормальными маргиналами, которые не являются двумерными, являются «патологическими», немного ошибочна.
Конечно, многомерная нормаль чрезвычайно важна из-за ее устойчивости при линейных преобразованиях, и поэтому ей уделяется большое внимание в приложениях.
Примеры
Полезно начать с некоторых примеров. На рисунке ниже представлены тепловые карты шести двумерных распределений, каждый из которых имеет стандартные нормальные маргинальные значения. Левый и средний в верхнем ряду - двумерные нормали, остальные - нет (как должно быть очевидно). Они описаны ниже.
Голые кости связок
Свойства зависимости часто эффективно анализируются с помощью связок . Двумерным копула это просто красивое название для распределения вероятностей на единицу площади с равномерными маргинальными.[0,1]2
Предположим, что - двумерная связка. Тогда, непосредственно из вышесказанного, мы знаем, что , и , например.C(u,v) C(u,v)≥0 C(u,1)=u C(1,v)=v
Мы можем построить двумерные случайные величины на евклидовой плоскости с заданными маргиналами простым преобразованием двумерной связки. Пусть и - предписанные маргинальные распределения для пары случайных величин . Тогда, если - двумерная связка, - двумерная функция распределения с маргиналами и . Чтобы увидеть этот последний факт, просто обратите внимание, что Тот же аргумент работает для .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2F1 F2 (X,Y) C(u,v)
Для непрерывного и , теорема Скляр в утверждает обратимо подразумевающий уникальность. То есть, учитывая двумерное распределение с непрерывными маргиналами , , соответствующая связка является уникальной (в соответствующем пространстве диапазонов).F1 F2 F(x,y) F1 F2
Бивариат нормальный является исключительным
Теорема Склара говорит нам (по существу), что есть только одна связка, которая производит двумерное нормальное распределение. Это метко названная гауссова связка с плотностью на где числитель - это двумерное нормальное распределение с корреляцией оцененной в и .[0,1]2
Но есть много других связок, и все они дадут двумерное распределение с нормальными маргиналами, которое не является двумерным нормальным, используя преобразование, описанное в предыдущем разделе.
Некоторые подробности на примерах
Обратите внимание, что если является произвольной связкой с плотностью , то соответствующая двумерная плотность со стандартными нормальными маргиналами при преобразовании естьC(u,v) c(u,v) F(x,y)=C(Φ(x),Φ(y))
Обратите внимание, что, применяя гауссову связку в вышеприведенном уравнении, мы восстанавливаем двумерную нормальную плотность. Но для любого другого выбора мы не будем.c(u,v)
Примеры на рисунке построены следующим образом (проходя по каждой строке по одному столбцу за раз):
источник
library(copula)
kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE)))
# force normal margins
evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1)))
contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
Это правда, что каждый элемент многовариантного нормального вектора сам по себе нормально распределен, и вы можете определить их средние значения и дисперсии. Однако неверно, что любые две гуасианские случайные величины совместно распределены нормально. Вот пример:
Изменить: В ответ на согласие, что случайная величина, которая является точечной массой, может рассматриваться как нормально распределенная переменная с , я изменяю свой пример.σ2=0
Пусть и где - случайная величина . То есть каждый с вероятностью .X∼N(0,1) Y=X⋅(2B−1) B Bernoulli(1/2) Y=±X 1/2
Сначала покажем, что имеет стандартное нормальное распределение.Y По закону полной вероятности ,
Следующий,
где - стандартный нормальный CDF . По аналогии,Φ
Следовательно,
Итак, CDF для есть , поэтому .Y Φ(⋅) Y∼N(0,1)
Теперь мы покажем, что совместно не распределены нормально.X,Y Как указывает @cardinal, одной из характеристик многомерной нормы является то, что каждая линейная комбинация ее элементов нормально распределена. не имеют этого свойства, так какX,Y
Поэтому представляет собой смесь случайной величины и точечной массы в 0, поэтому она не может быть нормально распределена.Y+X 50/50 N(0,4)
источник
Следующий пост содержит набросок доказательства, просто чтобы дать основные идеи и начать работу.
Пусть две независимые гауссовские случайные величины и пусть будетz=(Z1,Z2) x=(X1,X2)
Каждый , но так как они являются линейными комбинациями одного и того же независимого r.vs, они совместно зависимы.Xi∼N(μi,σ2i)
Определение Пара r.vs называется двумерной нормально распределенной, если ее можно записать в виде линейной комбинации независимой нормальной r.vs .x=(X1,X2) x=Az z=(Z1,Z2)
Лемма Если - двумерный гауссов, то любая другая их линейная комбинация снова является нормальной случайной величиной.x=(X1,X2)
Доказательство . Тривиально, пропущено, чтобы никого не обидеть.
Свойство Если некоррелированы, то они независимы и наоборот.X1,X2
РаспределениеX1|X2
Предположим, что - это те же гауссовы числа, что и раньше, но давайте предположим, что они имеют положительную дисперсию и нулевое среднее значение для простоты.X1,X2
Если - это подпространство, охватываемое , пусть и .S X2 XS1=ρσX1σX2X2 XS⊥1=X1−XS1
Разложение выполняется с помощью
Тогда
Две одномерные гауссовские случайные величины совместно являются гауссовыми, если условия и тоже гауссовы.X,Y X|Y Y|X
источник