Кластеризация с асимметричными измерениями расстояния

9

Как кластеризовать объект с асимметричной мерой расстояния?

Например, предположим, что вы кластеризуете набор данных с днями недели как функцией - расстояние от понедельника до пятницы не совпадает с расстоянием от пятницы до понедельника.

Как вы включаете это в меру расстояния алгоритма кластеризации?

Майкл
источник

Ответы:

3

Если расстояние СЧ является асимметричным, потому что будущее отличается от прошлого, тогда требуется подлинная асимметричная кластеризация. Во-первых, должна быть определена асимметричная функция расстояния.

Одним из способов асимметричной кластеризации с учетом функции расстояния является внедрение исходных данных в новое координатное пространство. См. «Геометрические структуры некоторых моделей на расстоянии для асимметричных МДС», автор Наохито Чино и Кеничи Ширайва, Behaviormetrika, 1992 ( pdf ). Это называется HCM (эрмитова каноническая модель).

ЧАС

ЧАСяJзнак равно12[d(Икся,ИксJ)+d(ИксJ,Икся)]+я12[d(Икся,ИксJ)-d(ИксJ,Икся)]

Это преобразует данные в пространство комплексных чисел. После того, как данные внедрены, расстояние между объектами x и y равно x * y, где * - сопряженная транспонирование. В этот момент вы можете запустить k-средних на комплексных векторов.

Спектрально-асимметричная кластеризация также была выполнена, см. Тезис Стефана Эмилова Атева «Использование асимметрии в спектральной кластеризации траекторий», Университет Миннесоты, 2011 г., который дает код MATLAB для специального алгоритма.

andy_a
источник
1

Вы можете взять какое-то среднее значение (например, среднее арифметическое или, для вероятностных распределений, квадратный корень из расхождения Дженсена – Шеннона).

киборг
источник
1

Вы должны взглянуть на круговую статистику (если вы хотите работать "в течение" недели обучения)

Лионель
источник
1

ИксИксTИкс

|дней|

ИксD

Джессика Коллинз
источник