Вопросы с тегом «pca»

9
Как найти отношения между различными типами событий (определяется их 2D-местоположением)?

У меня есть набор данных событий, которые произошли за тот же период времени. Каждое событие имеет тип (есть несколько разных типов, меньше десяти) и местоположение, представленное в виде 2D-точки. Я хотел бы проверить, есть ли какая-либо корреляция между типами событий, или между типом и...

9
Как интерпретировать результаты уменьшения размерности / многомерного масштабирования?

Я выполнил декомпозицию SVD и многомерное масштабирование 6-мерной матрицы данных, чтобы лучше понять структуру данных. К сожалению, все сингулярные значения имеют один и тот же порядок, подразумевая, что размерность данных действительно равна 6. Однако я хотел бы иметь возможность интерпретировать...

9
Когда выбрать PCA против LSA / LSI

Вопрос: Существуют ли общие рекомендации относительно характеристик входных данных, которые можно использовать для выбора между применением PCA и LSA / LSI? Краткое описание PCA против LSA / LSI: Принципиальный компонентный анализ (PCA) и скрытый семантический анализ (LSA) или скрытое семантическое...

9
Как сравнить наблюдаемые и ожидаемые события?

Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот моих четырех событий (18) я могу рассчитать ожидаемые частоты...

9
Почему величина дисперсии, описанная моим первым компьютером, так близка к средней попарной корреляции?

Какова связь между первым основным компонентом (ами) и средней корреляцией в матрице корреляции? Например, в эмпирическом приложении я наблюдаю, что средняя корреляция почти совпадает с отношением дисперсии первого главного компонента (первого собственного значения) к общей дисперсии (сумме всех...

9
Перекошенные переменные в PCA или факторный анализ

Я хочу провести анализ основных компонентов (факторный анализ) по SPSS на основе 22 переменных. Однако некоторые из моих переменных очень искажены (асимметрия, рассчитанная по SPSS, колеблется от 2 до 80!). Итак, вот мои вопросы: Должен ли я оставить таким образом перекошенные переменные или я могу...

9
Дискретные данные и альтернативы PCA

У меня есть набор данных с дискретными (порядковыми, меристическими и номинальными) переменными, описывающими морфологические признаки крыла нескольких близкородственных видов насекомых. То, что я хочу сделать, - это провести какой-то анализ, который бы дал мне визуальное представление о сходстве...

9
Является ли CCA между двумя идентичными наборами данных эквивалентными PCA в этом наборе данных?

Читая Википедию о каноническом корреляционном анализе (CCA) для двух случайных векторов и , мне стало интересно, совпадает ли анализ основных компонентов (PCA) с CCA, когда ?Y X =...

9
Использование анализа основных компонентов против анализа соответствия

Я анализирую набор данных, касающихся литоральных сообществ. Данные представляют собой процент покрытия (водорослей, ракушек, мидий и т. Д.) В квадратах. Я привык думать об анализе соответствия (CA) с точки зрения количества видов , а анализ основных компонентов (PCA) как о чем-то более полезном...

9
Неортогональная техника, аналогичная PCA

Предположим, у меня есть набор точечных данных 2D, и я хочу определить направления всех локальных максимумов дисперсии в данных, например: PCA не помогает в этой ситуации, так как это ортогональное разложение и, следовательно, не может обнаружить обе линии, которые я указал синим цветом, скорее его...

9
Как найти ковариационную матрицу многоугольника?

Представьте, что у вас есть многоугольник, определенный набором координат и его центр масс находится в . Вы можете рассматривать полигон как равномерное распределение с полигональной границей. (x1,y1)...(xn,yn)(x1,y1)...(xn,yn)(x_1,y_1)...(x_n,y_n)(0,0)(0,0)(0,0) Мне нужен метод, который найдет...

9
Что делает PCA с автокоррелированными данными?

Просто потому, что какой-то корреспондент задал интересный вопрос о методах вычисления автокорреляции, я начал играть с ним, почти не зная о временных рядах и автокорреляции. Корреспондент упорядочил свои данные ( точки данных временного ряда), сдвинутые на одну временную задержку каждая, кроме...

9
Какие критерии использовать для разделения переменных на объясняющие переменные и ответы для методов ординации в экологии?

У меня есть разные переменные, которые взаимодействуют в популяции. В основном я проводил инвентаризацию многоножек и измерял некоторые другие значения местности, например: Вид и количество собранных образцов Различных средах, где животные pH Процент органического материала количество P, K, Mg, Ca,...

9
Почему оценки основных компонентов некоррелированы?

Supose - это матрица среднецентрированных данных. Матрица равна , имеет различных собственных значений и собственные векторы , ... , которые являются ортогональными.S = cov ( A ) m × m m s 1 s 2 s mAA\mathbf AS=cov(A)S=cov(A)\mathbf S=\text{cov}(\mathbf A)m×mm×mm\times mmmms1s1\mathbf...

9
Как применить регрессию к основным компонентам для прогнозирования выходной переменной?

Я прочитал об основах анализа основных компонентов из учебника 1 , ссылки 1 и ссылки 2 . У меня есть набор данных из 100 переменных (включая выходную переменную Y), я хочу уменьшить переменные до 40 с помощью PCA, а затем предсказать переменную Y, используя эти 40 переменных. Проблема 1: После...

9
Вращайте компоненты PCA, чтобы выровнять дисперсию в каждом компоненте

Я пытаюсь уменьшить размерность и шум набора данных, выполняя PCA для набора данных и выбрасывая последние несколько ПК. После этого я хочу использовать некоторые алгоритмы машинного обучения на оставшихся ПК, и поэтому я хочу нормализовать данные путем выравнивания дисперсии ПК, чтобы алгоритмы...

9
На что указывает клиновидная форма графика PCA?

В своей работе по автоассоциатор для текста классификации Хинтон и Салахутдинов показал сюжет , полученный на 2-мерной LSA (который тесно связан с PCA) . Применяя PCA к совершенно другим слегка многомерным данным, я получил похожий график: (за исключением этого случая, я действительно хотел узнать,...

9
Масштабируемое уменьшение размера

Учитывая постоянное число функций, t-SNE Барнса-Хата имеет сложность , случайные проекции и PCA имеют сложность что делает их «доступными» для очень больших наборов данных.O ( n logн )О(Nжурнал⁡N)O(n\log n)O ( n )О(N)O(n) С другой стороны, методы, основанные на многомерном масштабировании, имеют...