Предположим есть вектор , который максимизирует дисперсию проекции данных с конструкцией матрицы .
Теперь я видел материалы , которые относятся в качестве (первого) основного компонента данных, который также является собственным вектором с наибольшим собственным значением.
Однако я также видел, что основным компонентом данных является .
Очевидно, и разные вещи. Может ли кто-нибудь помочь мне здесь и сказать мне, в чем разница между этими двумя определениями основных компонентов?
pca
terminology
definition
mynameisJEFF
источник
источник
Ответы:
Вы абсолютно правы, наблюдая, что хотя (один из собственных векторов ковариационной матрицы, например, первый) и X u (проекция данных на 1-мерное подпространство, натянутое на uu Xu u ) - это две разные вещи, оба из их часто называют «основным компонентом», иногда даже в одном и том же тексте.
В большинстве случаев из контекста ясно, что именно имеется в виду. В некоторых редких случаях, однако, это действительно может быть довольно запутанным, например , когда некоторые связанные с ними методы (такие как разреженный PCA или ОСО) обсуждаются, где разные направленияui не должны быть ортогональны. В этом случае утверждение типа «компоненты ортогональны» имеет очень разные значения в зависимости от того, относится ли оно к осям или проекциям.
Я бы выступать называя «Принципал ось» или «основным направлением», а X уu Xu А «основной компонент».
Я также виделu называете «главный компонент вектора».
Я должен упомянуть, что альтернативное соглашение состоит в том, чтобы называть «основным компонентом», а X u «оценками основного компонента».u Xu
Краткое изложение двух конвенций:
Примечание: только собственные векторы ковариационной матрицы, соответствующие ненулевым собственным значениям, могут называться главными направлениями / компонентами. Если ковариационная матрица имеет низкий ранг, она будет иметь одно или несколько нулевых собственных значений; соответствующие собственные векторы (и соответствующие проекции с постоянным нулем) не следует называть главными направлениями / компонентами. Смотрите обсуждение в моем ответе здесь.
источник