Вопросы с тегом «pca»

18
Как отбелить данные с помощью анализа основных компонентов?

Я хочу преобразовать свои данные так, чтобы отклонения были равны единице, а ковариации были равны нулю (т.е. я хочу отбелить данные). Кроме того, средства должны быть нулевыми.XX\mathbf X Я знаю, что доберусь туда, выполнив Z-стандартизацию и PCA-преобразование, но в каком порядке я должен их...

17
Анализ основных компонентов «в обратном направлении»: насколько дисперсия данных объясняется заданной линейной комбинацией переменных?

Я провел анализ главных компонентов шести переменных , B , C , D , E и F . Если я правильно понимаю, необращенный ПК1 говорит мне, какая линейная комбинация этих переменных описывает / объясняет наибольшую дисперсию в данных, а ПК2 говорит мне, какая линейная комбинация этих переменных описывает...

17
«Нормализующие» переменные для SVD / PCA

Предположим, у нас есть NNN измеримых переменных (a1,a2,…,aN)(a1,a2,...,aN)(a_1, a_2, \ldots, a_N) , мы выполняем ряд измерений M>NM>NM > N , а затем хотим выполнить разложение по сингулярным значениям результатов, чтобы найти оси наибольшей дисперсии для MMM точек в NNN мерном пространстве....

17
Надежные методы действительно лучше?

У меня есть две группы субъектов, A и B, каждая из которых имеет размер около 400 и около 300 предикторов. Моя цель - построить модель прогнозирования для бинарной переменной ответа. Мой клиент хочет увидеть результат применения модели, построенной из A на B. (В своей книге «Стратегии...

17
Взвешенный анализ основных компонентов

После некоторого поиска я обнаружил, что очень мало учитываю веса наблюдений / погрешности измерений в анализе основных компонентов. То, что я нахожу, имеет тенденцию полагаться на итеративные подходы для включения весов (например, здесь ). Мой вопрос: зачем нужен этот подход? Почему мы не можем...

17
Является ли ядро ​​PCA с линейным ядром эквивалентным стандартному PCA?

Если в ядре PCA я выберу линейное ядро , будет ли результат отличаться от обычного линейного PCA ? Решения принципиально отличаются или существует какое-то четко определенное отношение?K(x,y)=x⊤yK(x,y)=x⊤yK(\mathbf{x},\mathbf{y}) = \mathbf x^\top \mathbf...

17
Почему мы делим на стандартное отклонение, а не какой-то другой фактор стандартизации, прежде чем делать PCA?

Я читал следующее обоснование (из заметок курса cs229) о том, почему мы делим необработанные данные на их стандартное отклонение: хотя я понимаю, что говорится в объяснении, мне не ясно, почему деление на стандартное отклонение приведет к такой цели. Это говорит о том, что все больше в одном и том...

17
Каковы эффективные алгоритмы для вычисления разложения по сингулярным числам (SVD)?

В статье Википедии об анализе основных компонентов говорится, что Существуют эффективные алгоритмы для вычисления SVD без необходимости формирования матрицы , поэтому вычисление SVD теперь является стандартным способом вычисления анализа главных компонентов из матрицы данных, если только не...

17
Какова правильная мера связи переменной с компонентом PCA (на биплоте / графике загрузки)?

Я использую, FactoMineRчтобы свести мой набор данных измерений к скрытым переменным. Карта переменная выше ясно для меня , чтобы интерпретировать, но я смущен , когда речь идет о связях между переменными и компонента 1. Посмотрев на переменной карте, ddpи covочень близко к компоненту в карте, и...

17
Надежный PCA против надежного расстояния Махаланобиса для обнаружения выбросов

Надежный PCA (разработанный Candes et al. 2009 или более поздней версии Netrepalli et al 2014 ) является популярным методом многомерного обнаружения выбросов , но расстояние Махаланобиса также можно использовать для обнаружения выбросов с помощью надежной регуляризованной оценки ковариационной...

16
Являются ли компоненты PCA многомерных гауссовских данных статистически независимыми?

Являются ли компоненты PCA (в анализе главных компонентов) статистически независимыми, если наши данные многомерны и нормально распределены? Если да, то как это можно продемонстрировать / доказать? Я спрашиваю, потому что я видел этот пост , где верхний ответ гласит: PCA не делает явного...

16
Интерпретация баллов PCA

Может ли кто-нибудь помочь мне в интерпретации результатов PCA? Мои данные взяты из анкеты об отношении к медведям. Согласно нагрузкам, я интерпретировал один из моих основных компонентов как «страх медведей». Будут ли оценки этого основного компонента связаны с тем, как каждый респондент оценивает...

16
Оценка надежности вопросника: размерность, проблемные элементы, а также следует ли использовать альфа, лямбда6 или какой-то другой индекс?

Я анализирую оценки участников эксперимента. Я хочу оценить надежность моей анкеты, которая состоит из 6 пунктов, направленных на оценку отношения участников к продукту. Я вычислил альфу Кронбаха, рассматривая все элементы как одну шкалу (альфа был около 0,6) и удаляя один элемент за раз...

16
Когда мы объединяем уменьшение размерности с кластеризацией?

Я пытаюсь выполнить кластеризацию на уровне документов. Я построил матрицу частот термина-документа, и я пытаюсь кластеризовать эти высокоразмерные векторы с помощью k-средних. Вместо непосредственной кластеризации я сначала применил разложение сингулярных векторов LSA (скрытый семантический...

16
Какова связь между частичными наименьшими квадратами, регрессией пониженного ранга и регрессией главных компонент?

Являются ли регрессия с пониженным рангом и регрессия главных компонентов просто частными случаями частичных наименьших квадратов? В этом руководстве (Страница 6, «Сравнение целей») утверждается, что когда мы делаем частичные наименьшие квадраты без проецирования X или Y (то есть «не частичные»),...

16
Зачем преобразовывать данные в журнал перед выполнением анализа главных компонентов?

Я следую учебному пособию здесь: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/, чтобы лучше понять PCA. Учебное пособие использует набор данных Iris и применяет преобразование журнала до PCA: Обратите внимание, что в следующем коде мы применяем логарифмическое преобразование к...

16
PCA и k-кратная перекрестная проверка в пакете каретки в R

Я только что посмотрел лекцию из курса машинного обучения на Coursera. В разделе, где профессор обсуждает PCA для предварительной обработки данных в контролируемых учебных приложениях, он говорит, что PCA следует выполнять только на обучающих данных, а затем отображение используется для...

16
Отображение пространственной и временной корреляции на картах

У меня есть данные для сети метеостанций по всей территории Соединенных Штатов. Это дает мне фрейм данных, который содержит дату, широту, долготу и некоторое измеренное значение. Предположим, что данные собираются один раз в день и определяются погодой регионального масштаба (нет, мы не будем...

15
Какой метод множественного сравнения использовать для модели lmer: lsmeans или glht?

Я анализирую набор данных, используя модель смешанных эффектов с одним фиксированным эффектом (условием) и двумя случайными эффектами (участник из-за дизайна объекта и пары). Модель была сгенерирована с lme4пакетом: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Затем я...

15
В чем разница между обычным PCA и вероятностным PCA?

Я знаю, что обычный PCA не следует вероятностной модели для наблюдаемых данных. Так в чем же принципиальная разница между PCA и PPCA ? В PPCA модель скрытых переменных содержит, например, наблюдаемые переменные , скрытые (ненаблюдаемые переменные ) и матрицу , которая не должна быть...