Корреляция не подразумевает причинно-следственную связь, так как может быть много объяснений корреляции. Но подразумевает ли причинность корреляцию? Интуитивно я думаю, что наличие причинно-следственной связи означает, что существует определенная корреляция. Но моя интуиция не всегда хорошо служила мне в статистике. Означает ли причинность корреляцию?
correlation
causality
Мэтью
источник
источник
Ответы:
Как указывалось во многих ответах выше, причинно-следственная связь не подразумевает линейной корреляции . Поскольку многие понятия корреляции происходят из полей, которые в значительной степени зависят от линейной статистики, обычно корреляция рассматривается как равная линейной корреляции. Википедии статья является хорошо источником для этого, мне очень нравится этот образ:
Посмотрите на некоторые фигуры в нижнем ряду, например, форму параболы в 4-м примере. Это то, что происходит в ответе @StasK (с добавлением небольшого количества шума). Y может быть полностью вызвано X, но если числовое отношение не является линейным и симметричным, у вас все равно будет корреляция 0.
Слово, которое вы ищете, является взаимной информацией : это своего рода общая нелинейная версия корреляции. В этом случае ваше утверждение будет верным: причинно-следственная связь подразумевает высокую взаимную информацию .
источник
Строгий ответ «нет, причинно-следственная связь не обязательно подразумевает корреляцию».
Рассмотрим и . Причинность не становится сильнее: определяет . Тем не менее, корреляция между и равна 0. Доказательство: (объединенные) моменты этих переменных: ; ; используя свойство стандартного нормального распределения в том, что все его нечетные моменты равны нулю (можно легко получить, скажем, из его производящей момент функции). Следовательно, корреляция равна нулю.Y = X 2 ∼ χ 2 1 X Y X Y E [ X ] = 0 E [ Y ] = E [ X 2 ] E [X∼N(0,1) Y=X2∼χ21 X Y X Y E[X]=0 E[Y]=E[X2]=1
Чтобы ответить на некоторые комментарии: единственная причина, по которой этот аргумент работает, заключается в том, что распределение центрировано в нуле и симметрично относительно 0. На самом деле, любое другое распределение с этими свойствами, которое имело бы достаточное количество моментов, работало бы в место , например, равномерное на или Laplace . Упрощенный аргумент состоит в том, что для каждого положительного значения существует одинаково вероятное отрицательное значение той же величины, поэтому, когда вы возводите квадрат в квадрат , вы не можете сказать, что большие значения связаны с большими или меньшими значениями. изX N(0,1) (−10,10) ∼exp(−|x|) X X X X Y , Однако если вы скажете, скажем, , то , , и . Это имеет смысл: для каждого значения ниже нуля, есть гораздо более вероятное значение , которая находится выше нуля, так что большие значения связаны с большими значениями . (Последнее имеет нецентральную распределения , вы можете вытащить отклонение от страницы Википедии и вычислить корреляцию , если вы заинтересованы.)X∼N(3,1) E[X]=3 E[Y]=E[X2]=10 E[X3]=36 X - X X Y χ 2Cov[X,Y]=E[XY]−E[X]E[Y]=36−30=6≠0 X −X X Y χ2
источник
По сути, да.
Корреляция не подразумевает причинно-следственную связь, потому что могут быть другие объяснения корреляции вне причины Но для того, чтобы A была причиной B, они должны быть связаны каким-то образом . Это означает, что существует корреляция между ними - хотя эта корреляция не обязательно должна быть линейной.
Как предположили некоторые из комментаторов, более целесообразно использовать термин «зависимость» или «связь», а не корреляция. Хотя, как я упоминал в комментариях, я видел, что «корреляция не означает причинность» в ответ на анализ, выходящий за рамки простой линейной корреляции, и поэтому для целей высказывания я существенно расширил «корреляцию» на любую связь между А и Б.
источник
Добавление к ответу @EpiGrad. Я думаю, что для многих людей «корреляция» будет означать «линейную корреляцию». И концепция нелинейной корреляции может быть не интуитивной.
Итак, я бы сказал: «Нет, они не должны быть связаны, но они должны быть связаны ». Мы согласны с веществом, но не можем прийти к единому мнению, как лучше донести это вещество.
Одним из примеров такой причины (по крайней мере, люди думают, что это причинно-следственная связь) является случай между ответом на ваш телефон и доходом. Известно, что люди на обоих концах спектра доходов имеют меньше шансов ответить на их телефоны, чем люди в середине. Считается, что причинно-следственная связь различна для бедных (например, избегать сборщиков счетов) и богатых (например, избегать людей, просящих пожертвования).
источник
Рассмотрим следующую причинную модель:
Теперь позвольте:
Короче говоря, я бы сказал, что: (i) причинность предполагает зависимость; но, (ii) эта зависимость является функциональной / структурной зависимостью, и она может или не может преобразовываться в конкретную статистическую зависимость, о которой вы думаете.
источник
Причина и эффект будет коррелировать , если нет каких - либо изменений вообще в частоте и величине причины и без изменения вообще в причинной силы. Единственная другая возможность была бы, если бы причина полностью коррелировала с другой причинной переменной с совершенно противоположным эффектом. По сути, это условия мысленного эксперимента. В реальном мире, причинно - следственная связь будет означать зависимость в той или иной форме (хотя это может быть не линейной корреляции).
источник
Здесь есть отличные ответы. Артем Казнатчеев , Фомите и Питер Флом отмечают, что причинность обычно подразумевает зависимость, а не линейную корреляцию. Карлос Синелли приводит пример, в котором нет зависимости из-за того, как настроена генерирующая функция.
Я хочу добавить пункт о том, как эта зависимость может исчезнуть на практике, в тех наборах данных, с которыми вы могли бы хорошо работать. Ситуации, подобные примеру Карлоса, не ограничиваются просто «условиями мысленного эксперимента».
Зависимости исчезают в саморегулируемых процессах . Гомеостаз, например, гарантирует, что температура вашего тела остается независимой от комнатной температуры. Внешнее тепло напрямую влияет на температуру вашего тела, но также влияет на системы охлаждения тела (например, потоотделение), которые поддерживают температуру тела стабильной. Если мы измеряем температуру в чрезвычайно быстрых интервалах и используем чрезвычайно точные измерения, у нас есть шанс наблюдать причинные зависимости, но при нормальной частоте отбора проб температура тела и внешняя температура кажутся независимыми.
Саморегулируемые процессы распространены в биологических системах; они созданы эволюцией. Млекопитающие, которые не могут регулировать температуру своего тела, удаляются естественным отбором. Исследователи, работающие с биологическими данными, должны знать, что причинные зависимости могут исчезнуть в их наборах данных.
источник
Разве причина без какой-либо корреляции не была бы причиной?
Если, как следует из принятого ответа, вы используете невероятно ограниченную интерпретацию слова «корреляция», это глупый вопрос - если одна вещь «вызывает» другую, это по определению зависит от нее каким-то образом, является ли это увеличение населения или просто интенсивность.
правильно?
С другой стороны, вы могли бы обсуждать что-то более похожее, на видимость того, на что влияет что-то другое, что, я думаю, выглядело бы как причинно-следственная связь, но на самом деле вы не измеряете то, что, по вашему мнению, вы измеряете ...
Так что да, я думаю, что короткий ответ будет: «Да, если вы не можете создать энтропию».
источник