Как расстояние Гауэра вычисляет разницу между двоичными переменными?

13

У меня есть 17 числовых и 5 двоичных (0-1) переменных, с 73 выборками в моем наборе данных. Мне нужно запустить кластерный анализ. Я знаю, что расстояние Гауэра является хорошим показателем для наборов данных со смешанными переменными. Однако я не мог понять, как расстояние Гауэра рассчитывает разницу между двоичными переменными . Мне кажется, что это не отличается от евклидова расстояния.

Эмра Билгич
источник
Ваш вопрос не совсем понятен. Вы просто спрашиваете, «как расстояние Гауэра вычисляет разницу между двоичными переменными»? Что значит «нет никакой разницы, чем евклидова»?
gung - Восстановить Монику
1
Спасибо. Извините, я спрашиваю, как Гауэр рассчитывает разницу между двоичными переменными. Я имею в виду, я не мог понять различия между прочим. Евклидово и Гауэр для двоичной переменной.
Эмра Билгич
Вы искали этот сайт Gower? stats.stackexchange.com/a/15313/3277
ttnphns
Да, я сделал. Евклидово расстояние равно 0, если оба образца имеют одинаковое значение, 1, если нет. Что насчет Гауэра?
Эмра Билгич
4
@ EmrahBilgiç, показатель Гауэра - это сходство, а не расстояние. Он становится «расстоянием», когда вычитается из 1. Прочитайте по ссылке выше, как он обрабатывает двоичные данные.
ttnphns

Ответы:

5

Как насчет двоичных атрибутов, которые имеют значения «m» и «f», для «мужской» и «женский»?

Вы понимаете, что для двудольной переменной все, что вы можете получить, это «то же самое» или «другое»? Ключевой разницей между расстояниями нет, если значение равно 1 или 0; но как несколько переменных объединяются.

ВЫЙТИ - Anony-Mousse
источник
3

Gower distance использует Manhattan для вычисления расстояния между непрерывными точками данных и Dice для расчета расстояния между категориальными точками данных

Санджит
источник