Разве никакая корреляция не подразумевает никакой причинности?

73

Я знаю, что корреляция не подразумевает причинности, но означает ли отсутствие корреляции отсутствие причинности?

user2088176
источник
46
По словам Эндрю Гельмана, «корреляция даже не подразумевает корреляцию».
Майк Хантер
9
Нет. A может быть причиной B, но влияет на нее только нелинейно.
Нил Г
3
«Корреляция коррелирует с причинностью. (Просто не очень.)»
Адриан,
7
Пожалуйста, посмотрите на эту страницу для контрацептива. Если причинность не подразумевает корреляцию, то никакая корреляция не подразумевает никакой причинности.
EdM
4
Хотя это хорошее начало, чтобы отметить, что корреляция не подразумевает причинно-следственную связь, а затем обсудить детали, я долго думал, почему стоит выделить корреляцию? Я приписываю это созвучию и идее, привлекательной для учителей (и меня тоже), что ученики с некоторым усилием могут запомнить лозунг и использовать его в своем мышлении. Но правда в том, что в статистике не так уж много причин. Иначе говоря, это предупреждение часто встречается в главе о корреляции или в лекции о корреляции, но оно принадлежит везде.
Ник Кокс

Ответы:

76

означает ли отсутствие корреляции отсутствие причинности?

Нет. Любая контролируемая система является контрпримером.

Без причинно-следственных связей контроль явно невозможен, но успешный контроль означает - грубо говоря - что некоторая величина поддерживается постоянной, что означает, что она не будет коррелироваться с чем-либо, в том числе с какими-то фактами, которые делают ее постоянной.

Таким образом, в этой ситуации заключение причинно-следственной связи из-за отсутствия корреляции было бы ошибкой.

Вот несколько актуальный пример .

conjugateprior
источник
Интуитивно понятный способ думать об этом
Repmat
+1, интересный дубль. Однако представляется, что причинно-следственная связь может присутствовать, а корреляция любого рода отсутствует. Это не может быть правдой. Если какое-то событие вызывает другое, то будет присутствовать какая-то «корреляция», то есть константа, о которой вы упоминали, будет в форме нелинейной корреляции
Аксакал,
1
+1 Бра во! Когда я увидел заголовок вопроса на боковой панели, у меня появилось все: «Это требует ответа с точки зрения системы». Ты сделал это.
Алексис
Если из-за отсутствия корреляции удаляется причинно-следственная связь, будет ли оставшееся функционирование претендовать на ярлык «случайность»?
ttnphns
1
Не уверен, что понимаю вопрос @ ttnphns, но думаю, что ответ таков: если вы нажмете на тормозной трос (или отсоедините педаль акселератора), то холмы действительно начнут демонстрировать свое причинное влияние на скорость автомобиля.
conjugateprior
30

Нет. Главным образом потому, что под корреляцией вы, скорее всего, подразумеваете линейную корреляцию . Две переменные могут коррелироваться нелинейно и могут не иметь линейной корреляции . Подобный пример легко построить, но я приведу пример, который ближе к вашему (более узкому) вопросу.

Давайте посмотрим на случайную величину и неслучайную функцию , с помощью которой мы создаем случайную величину . Последнее явно вызвано первой переменной, а не просто коррелированной. Давайте нарисуем точечный график:xf(x)=x2y=f(x)

введите описание изображения здесь

Хорошая, четкая нелинейная корреляционная картина, но в данном случае это также прямая причинно-следственная связь. Тем не менее, коэффициент линейной корреляции несущественен, то есть не существует линейной корреляции, несмотря на очевидную нелинейную корреляцию и даже причинность:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

ОБНОВЛЕНИЕ: @Kodiologist прямо в комментарии. Математически можно показать, что коэффициент линейной корреляции для этих двух переменных действительно равен нулю. В моем примере - это стандартная нормальная переменная, поэтому имеем следующее: Следовательно, ковариация (и впоследствии корреляция) равна нулю: x

E[x]=0
E[x2]=1
E[xx2]=E[x3]=0
Cov[x,x2]=E[xx2]E[x]E[x2]=0

Мы получили бы тот же результат для любого симметричного распределения, такого как равномерное .U[1,1]

Аксакал
источник
8
Незначительность не подразумевает истинность нулевой гипотезы. Что важно в вашем примере, так это то, что коэффициент корреляции населения равен 0.
Кодиолог
1
Почему вы считаете, что ОП означает линейную корреляцию?
user253751
@immibis, потому что причинность должна приводить к какой-то нелинейной корреляции.
Аксакал
Почему корреляция равна нулю? Ковариация , и в общем случае для случайной величины тогда .. Это справедливо для стандартного нормально , хотяE[X3]E[X2]E[X]XE[X3]E[X2]E[X]X
Ant
@Ant, я использую стандартное нормальное для в примере MATLAB. Я обновил свой пост, чтобы было понятно. Спасибо за указание на это. x
Аксакал
18

Нет . В частности, случайные величины могут быть зависимыми, но некоррелированными.

Вот пример. Предположим, у меня есть машина, которая принимает один вход и выдает случайное число , равное или с равной вероятностью. Ясно вызывает . Теперь пусть - случайная переменная, равномерно распределенная на и выберите с , вызывая совместное распределение на . и зависимы, так какx[1,1]YxxxYX[1,1]Yx=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

Однако соотношение и равно 0, потому чтоYXY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]E[X]E[Y]σXσY=000σXσY=0.
Kodiologist
источник
1
На самом деле, это плохой пример, на мой взгляд. X не вызывает Y. Бинарная переменная, отсутствующая в модели PresenceOfX, является реальной причиной с корреляцией 1. То, что вы доказываете, на самом деле, что значение X не влияет на Y.
user2088176
6
Я действительно в растерянности , как вы могли бы чувствовать , что выбор не вызывает . Возможно, вам следует указать, что вы подразумеваете под «причиной». xY
Кодиолог
5
@ user2088176 Вот краткое доказательство того, что выбор вызывает . Давайте использовать Контрафактно модель причинно - следственной связи, в которой является индексом в набор возможных распределений для . Если , то равно или с равной вероятностью. Если , то равно или с равной вероятностью. Поскольку контрфактуалы, отличающиеся значением подразумевают различные распределения для , выбор вызываетxYxYx=12Y1212x=34Y -334 хYхY34xYxY .
Кодиолог
1
Этот пример, возможно, будет проще (и все еще работает), если мы ограничим до . [ 0 , 1 ]x[0,1]
JiK
3
Как насчет простого и стандартного примера: и . Они коррелированы , но -distributed совершенно зависит от . X 2 χ 2 ( 1 ) X 2 XXN(0,1)X2χ2(1)X2X
Therkel
14

Может быть, рассмотрение этого с вычислительной точки зрения поможет.

В качестве конкретного примера возьмем генератор псевдослучайных чисел.

Есть ли причинно-следственная связь между заданным вами начальным числом и выводом из генератора?kth

Есть ли измеримая корреляция?

Сабольч
источник
7

Лучшим ответом на этот вопрос является то, что корреляция - это статистические, математические и / или физические отношения, а причинность - это метафизические отношения. Вы не можете ЛОГИЧЕСКИ перейти от корреляции (или некорреляции) к причинности, без (большого) набора предположений, связывающих метафизику с физикой. (Одним из примеров является то, что два человека могут согласиться быть «рациональным наблюдателем» в значительной степени произвольно и, вероятно, неоднозначно). Если A платит B, чтобы выполнить C, что приводит к D, в чем причина D? Нет просто никакой разумной причины выбирать C или B или A (или любое из событий предшественника A). Теория управления имеет дело с системами в сферах, где они находятся под контролем. Один из способов получить под контроль зависимую переменную - это уменьшить реакцию этой переменной на возможный диапазон (контролируемого) изменения независимой переменной на статистический шум. Например, мы знаем, что давление воздуха соотносится со здоровьем (просто попробуйте дышать вакуумом), но если мы контролируем давление воздуха до 1 +/- 0,001 атм, насколько вероятно ЛЮБОЕ изменение давления воздуха для воздействия на здоровье?

Ли Чжи
источник
Различие, которое вам нужно, - это «наблюдаемое в образце» (корреляция) и зависимость, существующая независимо от того, наблюдается ли она в образце (физика). В этом объяснении метафизика не играет роли (хотя некоторые и предполагают физическое предположение). Пружины имеют пределы упругости независимо от того, достигают они или нет. Или в более простом примере: кусочек сахара растворим - явно причинно-следственная концепция, грубо говоря подразумевающая, что если вы уроните его в чай, он растворится. Но это причинное свойство обусловлено исключительно его физической структурой. Кубики сахара были бы растворимы, даже если бы мы никогда не думали растворить их.
сопряженный
1
Вы правы, конечно, что без причинных предположений в аргумент, вы не получите причинных выводов из этого. Но в этом нет ничего метафизического!
сопряженный
Впрочем, контрфактическая теория причинности (например, Перл или Вудворд) точно разработана для того, чтобы понять: «Если А платит В, чтобы сделать С, что приводит к D, то в чем причина D? Просто нет рациональной причины выбирать С, В или А». , Только старомодное понятие и бесполезно понятие , что эти теории развеялись в том , что мы всегда можем сделать SENE идеи , что есть причина чего - то. Конечно нет.
сопряженный
5

Да , вопреки предыдущим ответам. Я собираюсь принять вопрос как нетехнический, особенно определение "корреляции". Возможно я использую это слишком широко, но вижу мою вторую пулю. Я надеюсь, что будет уместно обсудить здесь другие ответы, потому что они освещают различные части вопроса. Я опираюсь на подход Перл к причинно-следственной связи, и, в частности, мой взгляд на это в некоторых работах с Кевином Корбом. Вудворд, вероятно, имеет самый ясный нетехнический отчет.

  • @conjugateprior говорит, что «любая контролируемая система является контрпримером». Да, к более сильному утверждению, что наблюдаемая в вашем эксперименте некорреляция не подразумевает причинно-следственной связи. Я собираюсь предположить, что вопрос более общий. Конечно, один эксперимент мог не справиться с маскирующими причинами или ненадлежащим образом контролировать общие последствия и скрыть корреляцию. Но если вызывает , будет проведен контролируемый эксперимент, в котором будут обнаружены эти отношения. Почти все определения или описания причинно-следственной связи рассматривают это как разницу, которая имеет значение. Поэтому нет причинно-следственной связи без (какой-то) взаимосвязи. Если в причинно-следственной байесовской сети имеется прямая ссылка , это не означает, чтоу х у х у у х уxyxyx всегда имеет значение для , только в том, что есть некоторый эксперимент, устраняющий все другие причины где покачивание покачивает .yyxy

  • У @aksakal есть отличный пример того, почему линейная причинность недостаточна. Договорились, но я хочу быть широким и нетехническим. Если , сказать клиенту, что не коррелирует с , будет неполным . Поэтому я буду использовать корреляцию очень широко, чтобы обозначить разницу в которая надежно связана с разницей в . Он может быть как нелинейным, так и непараметрическим. Пороговые эффекты хороши ( имеет значение для , но только в пределах конечного диапазона или только за счет того, что он больше или меньше определенного значения, например, напряжения в цифровых цепях). у х х у х уy=x2yxxyxy

  • @Kodiologist создает пример, где , поэтомуно нет линейной корреляции. Но очевидно, что есть обнаруживаемые отношения, которые коррелируют в широком смысле.| у | = | х |y=Unif(x,x)|y|=|x|

  • @Szabolcs использует генераторы случайных чисел, чтобы показать выходной поток, созданный, чтобы казаться некоррелированным. Как и цифры , поток кажется случайным, но детерминированным. Я согласен, что вы вряд ли найдете отношения, если даны только данные, но они есть.π

  • @ Ли Чжи отмечает, что вы не можете логически перейти от корреляции к причинности. Да, нет причин, нет причин. Но вопрос начинается с причинно-следственной связи: подразумевает ли это корреляцию? В примере с давлением воздуха мы имеем пороговый эффект. Существует диапазон, где давление воздуха не связано со здоровьем. Действительно правдоподобно там, где это не имеет причинно-следственного влияния на здоровье. Но есть диапазон, где это происходит. Этого достаточно. Но, вероятно, лучше отметить диапазоны, где есть и нет эффекта. Если , то существует корреляция по всей цепочке, потому что есть причинность. Повторное наблюдение (или эксперимент) может показать, что непосредственно не вызываетA DABCDAD но корреляция есть, потому что есть причинная история.

Я не знаю, что имел в виду @ user2088176, но я думаю, что если мы ответим на этот вопрос очень широко, то ответ будет положительным. По крайней мере, я думаю, что это ответ, требуемый в литературе о причинно-следственных связях и объяснении причинно-следственной связи. Причины - это различия, которые имеют значение. И это различие будет выявлено в каком-то эксперименте как устойчивая ассоциация.

ctwardy
источник
1
Я надеялся подойти к этому с более простой и нетехнической точки зрения, как вы. Что значит «причина»? Предположительно, это связано с изменением чего-то, что ведет к изменению чего-то другого. Я не могу понять причинно-следственную связь без какой-либо корреляции.
Behacad
1
@ Behacad Я думаю, что контраст между какой-то корреляцией (то, что вы можете наблюдать) и некоторой зависимостью (которая никогда не может быть вызвана). Есть неуправляемые зависимости, но нет ненаблюдаемых корреляций. Вот почему причинность имеет контрфактивный элемент в своем определении, а корреляция - нет.
сопряженный