Меня интересует природа . Кто-нибудь может сказать что-то интуитивное о том, «Что говорит о данных?»
Редактировать:
Спасибо за ответы
Пройдя несколько отличных курсов, я бы хотел добавить несколько моментов:
- Это мера информации, т. Е. это количество информации по направлению .
- Двойственность: Поскольку положительно определен, как и Σ - 1 , то есть они являются точечными нормами, точнее, они являются дуальными нормами друг друга, поэтому мы можем вывести двойственное число по Фенчелю для регуляризованной задачи наименьших квадратов и выполнить максимизацию относительно двойственной проблема. Мы можем выбрать любой из них, в зависимости от их условий.
- Гильбертово пространство: столбцы (и строки) из и Σ охватывают одно и то же пространство. Таким образом, нет никакого преимущества (кроме того, что когда одна из этих матриц плохо обусловлена) между представлением с Σ - 1 или Σ
- Статистика для частых: она тесно связана с информацией Фишера, используя границу Крамера – Рао. Фактически, информационная матрица Фишера (внешний продукт градиента логарифмического правдоподобия с самим собой) связана с Крамером-Рао, т.е. (относительно положительного полуопределенного конуса, iewrt концентрации эллипсоиды). Поэтому, когда максимальная оценка правдоподобия эффективна, т. Е. В данных существует максимальная информация, поэтому частотный режим является оптимальным. Проще говоря, для некоторых функций правдоподобия (обратите внимание, что функциональная форма правдоподобия зависит исключительно от вероятностной модели, которая предположительно генерирует данные, или генеративной модели), максимальное правдоподобие является эффективной и непротиворечивой оценщиком, правилом, подобным боссу. (извините за это)
Ответы:
Это мера точности так же, как является мерой дисперсии.Σ
Более детально, - это мера того, как переменные распределены вокруг среднего значения (диагональные элементы) и как они изменяются вместе с другими переменными (недиагональными) элементами. Чем больше дисперсия, чем дальше они находятся от среднего значения и чем больше они изменяются (по абсолютной величине) с другими переменными, тем сильнее у них тенденция «двигаться вместе» (в том же или противоположном направлении в зависимости от признак ковариации).Σ
Точно так же является мерой того, насколько плотно кластеризованы переменные вокруг среднего значения (диагональные элементы) и степени, в которой они не изменяются вместе с другими переменными (недиагональными элементами). Таким образом, чем выше диагональный элемент, тем плотнее переменная сгруппирована вокруг среднего значения. Интерпретация недиагональных элементов более тонкая, и я отсылаю вас к другим ответам для этой интерпретации.Σ−1
источник
Используя верхние индексы для обозначения элементов обратного, - это дисперсия компонента переменной которая не связана с другими переменными , и - это частичная корреляция переменных и , контролирующая другие переменные .1/σii i p−1 −σij/σiiσjj−−−−−√ i j p−2
источник