Я знаю, что корреляция не подразумевает причинности, но означает ли отсутствие корреляции отсутствие причинности?
correlation
causality
user2088176
источник
источник
Ответы:
Нет. Любая контролируемая система является контрпримером.
Без причинно-следственных связей контроль явно невозможен, но успешный контроль означает - грубо говоря - что некоторая величина поддерживается постоянной, что означает, что она не будет коррелироваться с чем-либо, в том числе с какими-то фактами, которые делают ее постоянной.
Таким образом, в этой ситуации заключение причинно-следственной связи из-за отсутствия корреляции было бы ошибкой.
Вот несколько актуальный пример .
источник
Нет. Главным образом потому, что под корреляцией вы, скорее всего, подразумеваете линейную корреляцию . Две переменные могут коррелироваться нелинейно и могут не иметь линейной корреляции . Подобный пример легко построить, но я приведу пример, который ближе к вашему (более узкому) вопросу.
Давайте посмотрим на случайную величину и неслучайную функцию , с помощью которой мы создаем случайную величину . Последнее явно вызвано первой переменной, а не просто коррелированной. Давайте нарисуем точечный график:x f(x)=x2 y=f(x)
Хорошая, четкая нелинейная корреляционная картина, но в данном случае это также прямая причинно-следственная связь. Тем не менее, коэффициент линейной корреляции несущественен, то есть не существует линейной корреляции, несмотря на очевидную нелинейную корреляцию и даже причинность:
ОБНОВЛЕНИЕ: @Kodiologist прямо в комментарии. Математически можно показать, что коэффициент линейной корреляции для этих двух переменных действительно равен нулю. В моем примере - это стандартная нормальная переменная, поэтому имеем следующее: Следовательно, ковариация (и впоследствии корреляция) равна нулю:x
Мы получили бы тот же результат для любого симметричного распределения, такого как равномерное .U[−1,1]
источник
Нет . В частности, случайные величины могут быть зависимыми, но некоррелированными.
Вот пример. Предположим, у меня есть машина, которая принимает один вход и выдает случайное число , равное или с равной вероятностью. Ясно вызывает . Теперь пусть - случайная переменная, равномерно распределенная на и выберите с , вызывая совместное распределение на . и зависимы, так какx∈[−1,1] Y x −x x Y X [−1,1] Y x=X (X,Y) X Y
Однако соотношение и равно 0, потому чтоYX Y
источник
Может быть, рассмотрение этого с вычислительной точки зрения поможет.
В качестве конкретного примера возьмем генератор псевдослучайных чисел.
Есть ли причинно-следственная связь между заданным вами начальным числом и выводом из генератора?kth
Есть ли измеримая корреляция?
источник
Лучшим ответом на этот вопрос является то, что корреляция - это статистические, математические и / или физические отношения, а причинность - это метафизические отношения. Вы не можете ЛОГИЧЕСКИ перейти от корреляции (или некорреляции) к причинности, без (большого) набора предположений, связывающих метафизику с физикой. (Одним из примеров является то, что два человека могут согласиться быть «рациональным наблюдателем» в значительной степени произвольно и, вероятно, неоднозначно). Если A платит B, чтобы выполнить C, что приводит к D, в чем причина D? Нет просто никакой разумной причины выбирать C или B или A (или любое из событий предшественника A). Теория управления имеет дело с системами в сферах, где они находятся под контролем. Один из способов получить под контроль зависимую переменную - это уменьшить реакцию этой переменной на возможный диапазон (контролируемого) изменения независимой переменной на статистический шум. Например, мы знаем, что давление воздуха соотносится со здоровьем (просто попробуйте дышать вакуумом), но если мы контролируем давление воздуха до 1 +/- 0,001 атм, насколько вероятно ЛЮБОЕ изменение давления воздуха для воздействия на здоровье?
источник
Да , вопреки предыдущим ответам. Я собираюсь принять вопрос как нетехнический, особенно определение "корреляции". Возможно я использую это слишком широко, но вижу мою вторую пулю. Я надеюсь, что будет уместно обсудить здесь другие ответы, потому что они освещают различные части вопроса. Я опираюсь на подход Перл к причинно-следственной связи, и, в частности, мой взгляд на это в некоторых работах с Кевином Корбом. Вудворд, вероятно, имеет самый ясный нетехнический отчет.
@conjugateprior говорит, что «любая контролируемая система является контрпримером». Да, к более сильному утверждению, что наблюдаемая в вашем эксперименте некорреляция не подразумевает причинно-следственной связи. Я собираюсь предположить, что вопрос более общий. Конечно, один эксперимент мог не справиться с маскирующими причинами или ненадлежащим образом контролировать общие последствия и скрыть корреляцию. Но если вызывает , будет проведен контролируемый эксперимент, в котором будут обнаружены эти отношения. Почти все определения или описания причинно-следственной связи рассматривают это как разницу, которая имеет значение. Поэтому нет причинно-следственной связи без (какой-то) взаимосвязи. Если в причинно-следственной байесовской сети имеется прямая ссылка , это не означает, чтоу х → у х у у х уx y x→y x всегда имеет значение для , только в том, что есть некоторый эксперимент, устраняющий все другие причины где покачивание покачивает .y y x y
У @aksakal есть отличный пример того, почему линейная причинность недостаточна. Договорились, но я хочу быть широким и нетехническим. Если , сказать клиенту, что не коррелирует с , будет неполным . Поэтому я буду использовать корреляцию очень широко, чтобы обозначить разницу в которая надежно связана с разницей в . Он может быть как нелинейным, так и непараметрическим. Пороговые эффекты хороши ( имеет значение для , но только в пределах конечного диапазона или только за счет того, что он больше или меньше определенного значения, например, напряжения в цифровых цепях). у х х у х уy=x2 y x x y x y
@Kodiologist создает пример, где , поэтомуно нет линейной корреляции. Но очевидно, что есть обнаруживаемые отношения, которые коррелируют в широком смысле.| у | = | х |y=Unif(x,−x) |y|=|x|
@Szabolcs использует генераторы случайных чисел, чтобы показать выходной поток, созданный, чтобы казаться некоррелированным. Как и цифры , поток кажется случайным, но детерминированным. Я согласен, что вы вряд ли найдете отношения, если даны только данные, но они есть.π
@ Ли Чжи отмечает, что вы не можете логически перейти от корреляции к причинности. Да, нет причин, нет причин. Но вопрос начинается с причинно-следственной связи: подразумевает ли это корреляцию? В примере с давлением воздуха мы имеем пороговый эффект. Существует диапазон, где давление воздуха не связано со здоровьем. Действительно правдоподобно там, где это не имеет причинно-следственного влияния на здоровье. Но есть диапазон, где это происходит. Этого достаточно. Но, вероятно, лучше отметить диапазоны, где есть и нет эффекта. Если , то существует корреляция по всей цепочке, потому что есть причинность. Повторное наблюдение (или эксперимент) может показать, что непосредственно не вызываетA DA→B→C→D A D но корреляция есть, потому что есть причинная история.
Я не знаю, что имел в виду @ user2088176, но я думаю, что если мы ответим на этот вопрос очень широко, то ответ будет положительным. По крайней мере, я думаю, что это ответ, требуемый в литературе о причинно-следственных связях и объяснении причинно-следственной связи. Причины - это различия, которые имеют значение. И это различие будет выявлено в каком-то эксперименте как устойчивая ассоциация.
источник