Мне интересно знать, что на самом деле происходит на расстоянии Хеллингера (простыми словами). Кроме того, мне также интересно узнать, какие типы проблем мы можем использовать для расстояния Хеллингера? Каковы преимущества использования Hellinger Distance?
machine-learning
data-mining
text-mining
distance
Кузнец волка
источник
источник
Ответы:
Расстояние Хеллингера - это показатель, измеряющий разницу между двумя вероятностными распределениями. Это вероятностный аналог евклидова расстояния .
Это полезно при количественной оценке разницы между двумя распределениями вероятностей. Например, если вы оцениваете распределение для пользователей и не пользователей службы. Если для некоторых объектов расстояние Хеллингера мало между этими группами, то эти объекты статистически не пригодны для сегментации.
источник