Рассмотрим контекст кластеризации дендрограмм. Давайте назовем оригинальные различия расстояниями между людьми. После построения дендрограммы мы определяем копенетическое различие между двумя индивидами как расстояние между кластерами, к которым эти индивиды принадлежат.
Некоторые люди считают, что корреляция между исходными различиями и копенетическими различиями (так называемая копенетическая корреляция ) является «индексом пригодности» классификации. Это звучит совершенно загадочно для меня. Мое возражение опирается не на конкретный выбор корреляции Пирсона, а на общую идею о том, что любая связь между исходными различиями и копенетическими различиями может быть связана с пригодностью классификации.
Согласны ли вы со мной или могли бы вы представить какой-либо аргумент в пользу использования копенетической корреляции в качестве индекса пригодности для классификации дендрограмм?
источник
general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification
. Классификация должна отражать первоначальные различия. Основная особенность дендрограммической классификации заключается в том, что это связано с копенетическим различием. Есть что-то неправильно?Ответы:
Мне не совсем понятно, что это значит. Как я понял, это то, что
является мерой иерархической структуры среди наблюдений , то есть их расстояний. То есть отличия от наблюдений в другом кластере предпочтительно одинаковы. Рассматривая наборы данных A и B, сгруппированные с использованием евклидова расстояния и полной связи ... ... даже не взирая на карту копенетического расстояния или не вычисляя копенетическую корреляцию, можно увидеть, что копенетическая корреляция A выше, чем у B В иерархии есть уровни. Таким образом, ЦК сообщает о том, одинаковы ли расстояния до наблюдений на одном уровне (кластере).
Для полноты картины: Копенетические корреляции: CC (A) = 0,936 и CC (B) = 0,691.
источник