Я продолжаю читать о случаях, когда мы центрируем данные (например, с помощью регуляризации или PCA), чтобы удалить перехват (как упомянуто в этом вопросе ). Я знаю, что это просто, но мне трудно понять это интуитивно. Может ли кто-нибудь предоставить интуицию или ссылку, которую я могу прочитать?
regression
pca
centering
сельдь
источник
источник
Ответы:
Могут ли эти картинки помочь?
Первые 2 картины о регрессии. Центрирование данных не изменяет наклон линии регрессии, но делает пересечение равным 0.
источник
PCA is maximizing variance
Это не совсем так. PCA максимизирует (по 1-му ПК) сумму квадратов отклонений от начала координат. Только если данные были предварительно центрированы (само центрирование не является частью PCA), это максимизирует дисперсию.