Я наткнулся на этот хороший учебник: Руководство по статистическому анализу с использованием R. Глава 13. Анализ основных компонентов: Олимпийский гепатлон о том, как делать PCA на языке R. Я не понимаю интерпретацию рисунка 13.3:
Итак, я строю первый собственный вектор против второго собственного вектора. Что это значит? Предположим, что собственное значение, соответствующее первому собственному вектору, объясняет 60% вариации в наборе данных, а второе собственное значение-собственный вектор объясняет 20% вариации. Что значит изображать их друг против друга?
r
pca
data-visualization
interpretation
biplot
user862
источник
источник
Ответы:
Тем не менее, я думаю, что вам лучше начать читать вводную книгу по многомерному анализу, чтобы глубже понять методы, основанные на PCA. Например, Б. Everitt написал прекрасный учебник по этой теме, R и S-Plus ® Companion в многомерный анализ , и вы можете проверить сайт компаньона для иллюстрации. Существуют и другие замечательные R-пакеты для прикладного многомерного анализа данных, такие как ade4 и FactoMineR .
источник
Сюжет показывает:
Левая и нижняя оси показывают [нормализованные] оценки основных компонентов; верхняя и правая оси показывают нагрузки.
В общем, предполагается, что два компонента объясняют достаточное количество дисперсии, чтобы обеспечить содержательное визуальное представление структуры случаев и переменных.
Вы можете посмотреть, какие события находятся близко друг к другу в пространстве. Если это применимо, это может указывать на то, что спортсмены, которые хороши в одном соревновании, вероятно, также будут хороши в других ближайших соревнованиях. В качестве альтернативы вы можете использовать сюжет, чтобы увидеть, какие события являются отдаленными. Например, метание копья кажется чем-то вроде выброса и основным событием, определяющим второй основной компонент. Возможно, другой тип спортсмена хорош в метании копья, чем в большинстве других соревнований.
Конечно, можно сказать больше о предметной интерпретации.
источник