Канонический корреляционный анализ (CCA) стремится максимизировать обычную корреляцию Пирсона с моментом произведения (то есть линейный коэффициент корреляции) линейных комбинаций двух наборов данных.
Теперь рассмотрим тот факт , что этот коэффициент корреляции только измеряет линейные ассоциаций - это причина того, почему мы используем, например, Spearman- или Кендал (ранг) коэффициенты корреляции измеряющие произвольный монотонный (не обязательно линейная) связь между переменными.τ
Следовательно, я думал о следующем: одним из ограничений CCA является то, что он пытается захватить только линейную связь между сформированными линейными комбинациями из-за своей целевой функции. Не было бы возможно расширить CCA в каком - то смысле, максимизируя, скажем, Spearman- вместо Pearson- г ?
Приведет ли такая процедура к чему-либо статистически интерпретируемому и значимому? (Имеет ли смысл - например - выполнять CCA в рядах ...?) Мне интересно, поможет ли это, когда мы имеем дело с ненормальными данными ...
Ответы:
Я использовал ограниченные расширения кубического сплайна при вычислении канонических переменных. Вы добавляете нелинейные базисные функции в анализ точно так же, как если бы вы добавляли новые функции. Это приводит к нелинейному анализу главных компонентов. См R
Hmisc
пакет «stranscan
функции для примера. Rhomals
пакет занимает это гораздо дальше.источник
Стандартный метод CCA работает с матрицей коэффициента корреляции продукта. Для наибольшего mgnitude CC он строит две составные переменные z1 (n) и z2 (n) путем линейной комбинации двух матиксов (с n строками и переменными m1 и m2), так что abs (корреляция (z1, z2)) максимизируется. Эта целевая функция может быть максимизирована напрямую, даже если корреляция (z1, z2) не является моментом произведения, а определяется по-другому.
Мишра С.К. (2009) «Записка об ординальном каноническом корреляционном анализе двух наборов ранжирующих баллов»
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319
источник