Я только что познакомился (смутно) с броуновской / дистанционной ковариацией / корреляцией . Это кажется особенно полезным во многих нелинейных ситуациях при тестировании на зависимость. Но это, кажется, не используется очень часто, хотя ковариация / корреляция часто используются для нелинейных / хаотических данных.
Это заставляет меня думать, что у ковариации расстояния могут быть некоторые недостатки. Так что же это такое, и почему не все всегда используют ковариацию расстояния?
correlation
covariance
distance-covariance
naught101
источник
источник
Ответы:
Я попытался собрать несколько замечаний о ковариации расстояния, основываясь на своих впечатлениях от чтения ссылок, перечисленных ниже. Однако я не считаю себя экспертом в этой теме. Комментарии, исправления, предложения и т. Д. Приветствуются.
Замечания (сильно) смещены в сторону потенциальных недостатков, как и требовалось в первоначальном вопросе .
На мой взгляд, потенциальные недостатки заключаются в следующем:
Повторюсь, этот ответ, вероятно, встречается довольно отрицательно. Но это не намерение. Есть несколько очень красивых и интересных идей, связанных с ковариацией расстояния, и относительная новизна этого также открывает исследовательские возможности для более полного ее понимания.
Рекомендации :
источник
Я вполне мог бы что-то упустить, но просто количественная оценка нелинейной зависимости между двумя переменными, похоже, не принесет больших результатов. Это не скажет вам форму отношений. Это не даст вам возможности предсказать одну переменную из другой. По аналогии, при проведении исследовательского анализа данных иногда используют кривую лёсса (локально взвешенный график рассеяния) в качестве первого шага, чтобы увидеть, лучше ли моделируются данные с помощью прямой линии, квадратичного, кубического и т. Д. Но потеря в и само по себе не очень полезный инструмент прогнозирования. Это всего лишь первое приближение на пути к поиску работоспособного уравнения для описания двумерной формы. Это уравнение, в отличие от лёсса (или результата ковариации расстояния), может служить основой подтверждающей модели.
источник