Что такое расстояние Махаланобиса и как оно используется в распознавании образов?

11

Может кто-нибудь объяснить мне концепцию расстояния Махаланобиса? Например, каково расстояние Махаланобиса между двумя точками x и y, и особенно, как оно интерпретируется для распознавания образов?

ayariga
источник
3
Что ты понимаешь об этом сейчас, что-нибудь? Вы пробовали Википедию?
gung - Восстановить Монику
2
Очень тесно связаны: stats.stackexchange.com/questions/62092/… .
whuber
Вы можете использовать эту ссылку. он также опишите , people.revoledu.com/kardi/tutorial/Similarity/...
Зоря

Ответы:

13

Расстояние Махаланобиса дает возможность измерить, насколько подобный набор условий похож на известный набор условий. Он учитывает ковариацию среди переменных.

Он рассчитывается как: где: D 2

D2=(xm)TC1(xm)
D2=Mahalanobis distancex=Vector of datam=Vector of mean values of independent variablesC1=Inverse Covariance matrix of independent variablesT=Indicates vector should be transposed

Эта страница содержит подробное объяснение (с примерами из анализа ландшафта).

надя
источник
1
спасибо, источник дал мне хорошее объяснение для начала
аярига
5

Расстояние Махаланобиса используется для нахождения выбросов в наборе данных. Я не знаю, в какой области вы находитесь, но в психологии это используется для выявления случаев, которые не «вписываются» в то, что ожидается, учитывая нормы для набора данных. Например, если ваша выборка состоит из людей с низким уровнем депрессии, и у вас есть один или два человека с очень высоким уровнем депрессии, то у них будут расстояния Махаланобиса, которые превышают ожидаемое критическое значение. Возможно, вы захотите удалить эти случаи, если они очень экстремальные И если вы считаете, что они не вписываются в ваш набор данных. (Используя приведенный пример, ваша выборка состоит из людей с низким уровнем депрессии, поэтому один или два человека с высоким уровнем депрессии не соответствуют остальным). Выявление выбросов очень важно, потому что многие статистические анализы имеют «допущение нормальности», то есть ожидание, что ваши данные будут нормально распределены. Выбросы также могут вносить вклад в искаженные данные, и по этой причине они также должны быть удалены. (Если вы не преобразуете всю переменную, и это не исправляет перекос). Многие программы статистики, такие как SPSS, позволяют вычислять расстояния M и вероятность, связанную с каждым показателем, чтобы идентифицировать выбросы. Я могу предоставить вам инструкции SPSS, но я не знаю, используете ли вы SPSS. (Если вы не преобразуете всю переменную, и это не исправляет перекос). Многие программы статистики, такие как SPSS, позволяют вычислять расстояния M и вероятность, связанную с каждым показателем, чтобы идентифицировать выбросы. Я могу предоставить вам инструкции SPSS, но я не знаю, используете ли вы SPSS. (Если вы не преобразуете всю переменную, и это не исправляет перекос). Многие программы статистики, такие как SPSS, позволяют вычислять расстояния M и вероятность, связанную с каждым показателем, чтобы идентифицировать выбросы. Я могу предоставить вам инструкции SPSS, но я не знаю, используете ли вы SPSS.

Мэдлин
источник