Различные типы ковариации для гауссовых моделей смесей

13

При попытке гауссовой смеси Модели здесь , я нашел эти 4 типа ковариаций.

'full' (each component has its own general covariance matrix),
'tied' (all components share the same general covariance matrix),
'diag' (each component has its own diagonal covariance matrix),
'spherical' (each component has its own single variance).

Я много гуглил, чтобы найти больше деталей о каждом из этих типов, но нашел только описания очень высокого уровня (такие как этот ).

Цените, если кто-то может помочь мне понять это, или, по крайней мере, направить меня туда, где я могу прочитать об этом.

пчелка
источник

Ответы:

17

Гауссово распределение полностью определяется его ковариационной матрицей и средним значением (местоположение в пространстве). Ковариационная матрица гауссовского распределения определяет направления и длины осей контуров его плотности, которые все являются эллипсоидами.

(0,0)(4,5)3/52/5

фигура

При нажатии на изображение отобразится версия с более высоким разрешением.

NB Это графики реальных смесей, а не отдельных компонентов. Поскольку компоненты хорошо разделены и имеют сопоставимый вес, контуры смеси очень похожи на контуры компонентов (за исключением низких уровней, где они могут искажаться и сливаться, как показано, например, в центре «привязанного» графика).

  • Полный означает, что компоненты могут независимо принимать любую позицию и форму.

  • Связанный означает, что они имеют одинаковую форму, но форма может быть любой.

  • Диагональ означает, что контурные оси ориентированы вдоль координатных осей, но в противном случае эксцентриситеты могут различаться между компонентами.

  • Связанная диагональ - это «связанная» ситуация, когда оси контуров ориентированы вдоль осей координат. (Я добавил это, потому что изначально это было то, как я неправильно истолковал «диагональ».)

  • Сферическая - это «диагональная» ситуация с круговыми контурами (сферическая в более высоких измерениях, откуда и название).

nn(n+1)/2

Whuber
источник
Отличный ответ. Спасибо. И последний вопрос. Это только 4 типа? или есть и другие типы?
Пчела
1
1
Благодарю. Я просто сравнил приведенное описание в своем посте и ваш ответ. В моем случае «Связанный» является единственным, который используется всеми компонентами. Но в вашем «Full» кажется единственным, который НЕ разделяется каждым компонентом. Я просто чувствую, что эти 2 противоречат. (Я уверен, что что-то упустил). Вы не против объяснить это? Большое спасибо.
Пчела
Я не вижу никакого противоречия: я точно представил условия, которые вы изложили. Действительно, я не ссылался ни на какие другие источники для создания этих изображений.
whuber
1
Спасибо - я понимаю, что вы имеете в виду. Я обновлю объяснение, чтобы отразить это.
whuber