Я использую означает кластеризацию для кластеризации голосов ораторов. Когда я сравниваю высказывание с данными кластерного динамика, я получаю (евклидово основанное на расстоянии) среднее искажение. Это расстояние может быть в диапазоне . Я хочу преобразовать это расстояние в сходство. Пожалуйста, объясните мне, как я могу этого достичь.
clustering
k-means
distance
euclidean
Мухаммед
источник
источник
Вы также можете использовать: гдеваша желаемая функция расстояния.1edist
dist
источник
Звучит так, будто вы хотите что-то похожее на косинусное сходство, которое само по себе является показателем сходства в единичном интервале. На самом деле существует прямая связь между евклидовым расстоянием и косинусным сходством!
Обратите внимание, что
so
From a computational perspective, it may be more efficient to just compute the cosine, rather than Euclidean distance and then perform the transformation.
источник
How about a Gaussian kernel ?
The distance∥x−x′∥ is used in the exponent. The kernel value is in the range [0,1] . There is one tuning parameter σ . Basically if σ is high, K(x,x′) will be close to 1 for any x,x′ . If σ is low, a slight distance from x to x′ will lead to K(x,x′) being close to 0.
источник
If you are using a distance metric that is naturally between 0 and 1, like Hellinger distance. Then you can use 1 - distance to obtain similarity.
источник