Метрики для ковариационных матриц: недостатки и сильные стороны

11

Каковы «лучшие» метрики для ковариационных матриц и почему? Мне ясно, что Frobenius и c не подходят, и у параметризации угла тоже есть свои проблемы. Интуитивно можно хотеть компромисса между этими двумя, но я также хотел бы знать, есть ли другие аспекты, о которых следует помнить, и, возможно, устоявшиеся стандарты.

Обычные метрики имеют различные недостатки, поскольку они не являются естественными для ковариационных матриц, например, они часто не особенно штрафуют не PSD-матрицы или не ведут себя хорошо по рангу (рассмотрим два повернутых ковариационных эллипсоида низкого ранга: я бы хотел того же -пустите промежуточное вращение, чтобы иметь более низкие расстояния, чем среднее по компонентам, что не относится к и, возможно, к Фробениусу, пожалуйста, исправьте меня здесь). Также выпуклость не всегда гарантируется. Было бы хорошо, если бы эти и другие вопросы решались с помощью «хорошей» метрики.L1

Вот хорошее обсуждение некоторых вопросов, один пример из оптимизации сети и один из компьютерного зрения . И вот аналогичный вопрос, получая некоторые другие метрики, но без обсуждения.

кварцевый
источник
2
Какова цель метрики, которую вы ищете? Для чего не подходит метрика Фробениуса?
whuber
1
@whuber: Я хотел бы получить общий обзор, прежде чем вводить слишком много ограничений. Моя сфера - количественные финансы, где большинство людей для простоты придерживаются Фробениуса. Обычные метрики имеют различные недостатки, поскольку они не являются естественными для ковариационных матриц, например, они не особенно штрафуют не PSD-матрицы и не ведут себя хорошо с рангами (вспомним два повернутых ковариационных эллипсоида низкого ранга: мне бы хотелось промежуточное вращение одного ранга) иметь меньшие расстояния, чем среднее по компонентам, что не относится к и, возможно, к Фробениусу, если я не ошибаюсь). Добавлено несколько ссылок. L1
Кварц
Как последний вопрос, на который вы ссылаетесь, «более ограниченный»? Ведь все ковариационные матрицы симметричны. Кажется, это идеальный дубликат.
whuber
1
Это хорошая критика другого вопроса. Могу ли я предложить вам отредактировать свой вопрос (и заголовок), чтобы отразить содержание вашего последнего комментария? Это будет четко отличать его от очевидного дубликата и поможет респондентам дать вам более подходящие ответы. (И не беспокойтесь об изменениях в своем собственном вопросе: это ожидается; мета-поток в основном касается редактирования сообщества .)
whuber
1
@kjetilbhalvorsen Это провокационное предложение! Не могли бы вы расширить в ответ? Или предоставить ссылку на статью?
Sycorax говорит восстановить Монику

Ответы:

2

Ну, я не думаю, что есть хороший показатель или «лучший способ» для анализа ковариационных матриц. Анализ всегда должен соответствовать вашей цели. Допустим, C - моя ковариационная матрица. Диагональ содержит дисперсию для каждого вычисляемого параметра. Так что, если вы заинтересованы в значении параметров, тогда трассировка (C) - это хорошее начало, так как это ваша общая производительность.

Если вы построите свой параметр и его значение, вы увидите что-то вроде этого:

x1 =  1.0 ±  0.1 
x2 = 10.0 ±  5.0
x3 =  5.0 ± 15.0 <-- non-significant parameter

Если вы заинтересованы в их взаимной корреляции, то такая таблица может дать что-то интересное:

x1  1.0
x2  0.9  1.0
x3 -0.3 -0.1  1.0
    x1    x2   x3

Каждый элемент является коэффициентом корреляции между параметром xi и xj. Из примера видно, что параметры x1 и x2 сильно коррелированы.

нал
источник
1

Интересный вопрос, я сейчас занимаюсь той же проблемой! Это зависит от того, как вы определяете «лучшее», то есть ищете ли вы какое-то среднее значение для спреда или для корреляции между данными и т. Д. Я нашел в Press, SJ (1972): Applied Multivariate Analysis, p. 108, что обобщенная дисперсия, определенная как определитель ковариационной матрицы, полезна в качестве единственной меры для разброса. Но если вам нужна корреляция, мне нужно подумать дальше. Дай мне знать.

Lucozade
источник
3
Ссылка пожалуйста.
Ник Кокс