В кластерном анализе, как мы рассчитываем чистоту? Какое уравнение?
Я не ищу код, чтобы сделать это для меня.
Пусть - кластер k, а - класс j.
Так чистота практически точность? похоже, что суммирование действительно классифицированного класса на кластер по размеру выборки.
Вопрос в том, какова связь между выходом и входом?
Если есть действительно положительный (TP), истинно отрицательный (TN), ложно положительный (FP), ложно отрицательный (FN). Это ?
clustering
Iancovici
источник
источник
Ответы:
В контексте кластерного анализа чистота является внешним критерием оценки качества кластера. Это процент от общего количества объектов (точек данных), которые были классифицированы правильно, в диапазоне единиц [0..1].
источник