Я знаю, как математически рассчитать PCA и SVD, и я знаю, что оба могут быть применены к регрессии линейных наименьших квадратов.
Основным преимуществом SVD математически представляется то, что его можно применять к неквадратным матрицам.
Оба сосредоточены на разложении матрицыПомимо упомянутого преимущества SVD, есть ли какие-либо дополнительные преимущества или идеи, предоставляемые при использовании SVD по сравнению с PCA?
Я действительно ищу интуицию, а не математические различия.
pca
least-squares
svd
Baz
источник
источник
advantage... SVD over PCA
- SVD и PCA нельзя сравнивать как математическую операцию и метод анализа данных. Ваш вопрос может быть что-то о способах сделать PCA ? Или что ты спрашиваешь?Ответы:
Как сказали @ttnphns и @ nick-cox, SVD - это численный метод, а PCA - это метод анализа (например, метод наименьших квадратов). Вы можете сделать PCA, используя SVD, или вы можете сделать PCA, выполняя собственные разложения (или ), или вы можете сделать PCA, используя множество других методов, так же, как вы можете решать наименьшие квадраты с помощью дюжины различных алгоритмов. как метод Ньютона или градиентного спуска или SVD и т. д.ИксТИкс ИксИксТ
Таким образом, у SVD нет «преимущества» перед PCA, потому что это все равно, что спрашивать, является ли метод Ньютона лучше, чем метод наименьших квадратов: эти два несопоставимы.
источник
Вопрос действительно в том, нужно ли вам выполнить нормализацию столбцов по Z-шкале перед применением SVD. Это потому, что PCA является вышеупомянутым преобразованием, за которым следует SVD. Иногда делать нормализацию довольно вредно. Если ваши данные, например, являются (преобразованными) количеством слов, которые являются положительными, вычитание среднего значения определенно вредно. Это связано с тем, что нули, обозначающие отсутствие слова в документе, будут сопоставлены с отрицательными числами с высокой величиной. В линейных задачах следует использовать более высокую величину, чтобы представить диапазон, в котором ваши функции наиболее чувствительны. Также деление на стандартное отклонение вредно для этого типа данных.
источник