Вопросы с тегом «pca»

10
Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки:...

10
Как интерпретировать этот биплот PCA, исходя из опроса, в каких областях люди заинтересованы?

История вопроса: я спросил у сотен участников моего опроса, насколько они заинтересованы в выбранных областях (по пятибалльной шкале Лайкерта, где 1 обозначает «неинтересно», а 5 - «заинтересовано»). Затем я попробовал PCA. Картинка ниже представляет собой проекцию первых двух основных компонентов....

10
Сокращение размеров всегда теряет некоторую информацию?

Как видно из названия, всегда ли уменьшение размеров теряет некоторую информацию? Рассмотрим для примера PCA. Если у меня очень мало данных, я бы предположил, что может быть найдена «лучшая кодировка» (это как-то связано с рангом данных?), И ничего не будет...

10
Когда вы будете использовать PCA, а не LDA в классификации?

Я читаю эту статью о разнице между Принципиальным компонентным анализом и множественным дискриминантным анализом (линейный дискриминантный анализ) и пытаюсь понять, почему вы когда-либо использовали PCA вместо MDA / LDA. Объяснение сводится к следующему: Грубо говоря, в PCA мы пытаемся найти оси с...

10
Каковы хорошие показатели для оценки качества соответствия PCA, чтобы выбрать количество компонентов?

Что является хорошим показателем для оценки качества анализа главных компонентов (PCA)? Я выполнил этот алгоритм на наборе данных. Моей целью было уменьшить количество функций (информация была очень избыточной). Я знаю, что процент сохраняемой дисперсии является хорошим показателем того, сколько...

10
Запутался в визуальном объяснении собственных векторов: как визуально разные наборы данных могут иметь одинаковые собственные векторы?

Многие учебники статистики предоставляют интуитивно понятную иллюстрацию того, каковы собственные векторы ковариационной матрицы: Векторы u и z образуют собственные векторы (ну, собственные оси). Это имеет смысл. Но меня смущает то, что мы извлекаем собственные векторы из корреляционной матрицы, а...

10
Применение PCA для проверки данных в целях классификации

Недавно я узнал о замечательном PCA, и я сделал пример, изложенный в документации scikit-learn . Мне интересно знать, как я могу применить PCA к новым точкам данных для целей классификации. После визуализации PCA в двухмерной плоскости (ось x, y) я вижу, что, вероятно, могу нарисовать линию, чтобы...

10
PCA все еще делается через собственное разложение ковариационной матрицы, когда размерность больше, чем число наблюдений?

У меня есть матрица X размером , содержащая мои N = 20 выборок в D = 100- мерном пространстве. Теперь я хочу написать свой собственный анализ основных компонентов (PCA) в Matlab. Сначала я унижаю X до X 0 .20×10020×10020\times100XXXN=20N=20N=20D=100D=100D=100XXXX0X0X_0 Я читал из чьего-то кода, что...

10
Разница между PCA и спектральной кластеризацией для небольшого выборочного набора булевых функций

У меня есть набор данных из 50 образцов. Каждый образец состоит из 11 (возможно, коррелированных) булевых функций. Я хотел бы кое-что визуализировать эти образцы на двухмерном графике и изучить, есть ли кластеры / группировки среди 50 образцов. Я попробовал следующие два подхода: (a) Запустите PCA...

10
В Факторном анализе (или в PCA), что означает загрузку фактора больше 1?

Я только что запустил FA, используя наклонное вращение (promax), и элемент дал коэффициент загрузки 1,041 для одного фактора (и коэффициент загрузки -131, -.119 и .065 для других факторов с использованием матрицы шаблонов ) , И я не уверен, что это значит, я думал, что это может быть только между...

10
Почему все компоненты PLS вместе объясняют только часть дисперсии исходных данных?

У меня есть набор данных, состоящий из 10 переменных. Я запустил частичные наименьшие квадраты (PLS), чтобы предсказать одну переменную ответа по этим 10 переменным, извлек 10 компонентов PLS, а затем вычислил дисперсию каждого компонента. По исходным данным я взял сумму дисперсий всех переменных,...

10
Возможна ли крупномасштабная PCA?

Классический метод анализа основных компонентов (PCA) состоит в том, чтобы сделать это на матрице входных данных, столбцы которой имеют нулевое среднее значение (тогда PCA может «максимизировать дисперсию»). Это может быть легко достигнуто путем центрирования колонн. Тем не менее, когда входная...

10
Что подразумевается под PCA, сохраняя только большие попарные расстояния?

В настоящее время я читаю технику визуализации t-SNE, и было упомянуто, что одним из недостатков использования анализа главных компонентов (PCA) для визуализации многомерных данных является то, что он сохраняет только большие попарные расстояния между точками. Значимые точки, которые находятся...

10
Можно ли использовать анализ основных компонентов по ценам на акции / нестационарным данным?

Я читаю пример, приведенный в книге « Машинное обучение для хакеров» . Сначала я подробно остановлюсь на примере, а затем расскажу о своем вопросе. Пример : Принимает набор данных за 10 лет по 25 ценам на акции. Работает PCA на 25 акций. Сравнивает основной компонент с индексом Доу-Джонса....

10
В документе упоминается «моделирование по методу Монте-Карло для определения количества основных компонентов»; как это работает?

Я делаю анализ Matlab на данных МРТ, где я выполнил PCA на матрице размером 10304x236, где 10304 - это количество вокселей (представьте их как пиксели), а 236 - количество временных точек. PCA дает мне 236 собственных значений и связанных с ними коэффициентов. Это все хорошо. Однако, когда приходит...

10
Обратная ковариационная матрица против ковариационной матрицы в PCA

В PCA, имеет ли значение, если мы выбираем главные компоненты обратной ковариационной матрицы ИЛИ, если мы отбрасываем собственные векторы ковариационной матрицы, соответствующие большим собственным значениям? Это связано с обсуждением в этом посте...

10
Как получить «собственные значения» (проценты объясненной дисперсии) векторов, которые не являются собственными векторами PCA?

Я хотел бы понять, как я могу получить процент дисперсии набора данных не в координатном пространстве, предоставленном PCA, а по отношению к немного другому набору (повернутых) векторов. set.seed(1234) xx <- rnorm(1000) yy <- xx * 0.5 + rnorm(1000, sd = 0.6) vecs <- cbind(xx, yy)...

9
Как найти отношения между различными типами событий (определяется их 2D-местоположением)?

У меня есть набор данных событий, которые произошли за тот же период времени. Каждое событие имеет тип (есть несколько разных типов, меньше десяти) и местоположение, представленное в виде 2D-точки. Я хотел бы проверить, есть ли какая-либо корреляция между типами событий, или между типом и...

9
Использование анализа основных компонентов против анализа соответствия

Я анализирую набор данных, касающихся литоральных сообществ. Данные представляют собой процент покрытия (водорослей, ракушек, мидий и т. Д.) В квадратах. Я привык думать об анализе соответствия (CA) с точки зрения количества видов , а анализ основных компонентов (PCA) как о чем-то более полезном...