Как причинно-следственная связь определяется математически?

16

Каково математическое определение причинно-следственной связи между двумя случайными величинами?

Учитывая выборку из совместного распределения двух случайных величин и , когда мы скажем, что вызывает ?XYXY

Для контекста, я читаю эту статью о причинно-следственной связи .

Джейн
источник
2
Насколько я понимаю, причинно-следственная связь является научным, а не математическим понятием. Можете ли вы отредактировать, чтобы уточнить?
mdewey
2
@ mdewey Я не согласен. Причинность может быть обналичена в совершенно формальных терминах. Смотрите, например, мой ответ.
Кодиолог

Ответы:

9

Каково математическое определение причинно-следственной связи между двумя случайными величинами?

Математически причинная модель состоит из функциональных отношений между переменными. Например, рассмотрим систему структурных уравнений ниже:

x=fx(ϵx)y=fy(x,ϵy)

Это означает, что x функционально определяет значение y (если вы вмешиваетесь в x это меняет значения y ), но не наоборот. Графически это обычно представляется как xy , что означает, что x входит в структурное уравнение y. В качестве дополнения вы также можете выразить причинную модель в терминах совместного распределения контрфактуальных переменных, что математически эквивалентно функциональным моделям .

Учитывая выборку из совместного распределения двух случайных величин X и Y, когда мы скажем, что X вызывает Y?

Иногда (или в большинстве случаев) вы неfxfy знаете ни формы структурных уравнений f x , f y , ни даже xy или yx . Единственная имеющаяся у вас информация - это совместное распределение вероятностей p(y,x) (или выборки из этого распределения).

Это приводит к вашему вопросу: когда я могу восстановить направление причинности только из данных? Или, точнее, когда я могу восстановить, входит ли x в структурное уравнение y или наоборот, только из данных?

Конечно, без каких-либо принципиально непроверенных предположений о причинно-следственной модели это невозможно . Проблема состоит в том, что несколько различных причинных моделей могут повлечь за собой одно и то же совместное распределение вероятностей наблюдаемых переменных. Наиболее распространенным примером является причинно-следственная линейная система с гауссовским шумом.

Но при некоторых причинных предположениях это могло бы быть возможным - и это то, над чем работает литература по обнаружению причинно-следственных связей. Если вы не знакомы с этой темой ранее, вы можете начать с « Элементы причинно-следственной связи» Петерса, Янцинга и Шолкопфа, а также с главы 2 «Причинность » Иудеи Перл. У нас есть тема здесь, в резюме для ссылок на обнаружение причинно-следственной связи , но у нас пока не так много ссылок.

Поэтому на ваш вопрос не существует только одного ответа, поскольку он зависит от допущений, которые вы делаете. В упомянутой вами статье приводятся некоторые примеры, например, использование линейной модели с негауссовым шумом. Этот случай известен как LINGAN (сокращение от линейной негауссовой ациклической модели), вот пример в R:

library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1

# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat") 

# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
#     [,1]  [,2]
# [1,] .     .   
# [2,]  TRUE .     

Обратите внимание, что здесь мы имеем линейную причинную модель с негауссовым шумом, где x2 вызывает x1 а лингам корректно восстанавливает причинное направление. Однако обратите внимание, что это критически зависит от предположений LINGAM.

Что касается цитируемой вами статьи, они делают это конкретное предположение (см. Их «постулат»):

Если xy , минимальная длина описания механизма, отображающего X в Y, не зависит от значения X, тогда как минимальная длина описания механизма, отображающего Y в X, зависит от значения Y.

Обратите внимание, это предположение. Это то, что мы бы назвали их «условием идентификации». По существу, постулат накладывает ограничения на совместное распределение p(x,y) . То есть постулат говорит, что если xy в данных выполняются определенные ограничения, а если yx другие ограничения выполняются. Эти типы ограничений, которые имеют проверяемые значения (накладывают ограничения на p(y,x) ), - это то, что позволяет направленно восстанавливаться из данных наблюдений.

Как последнее замечание, результаты обнаружения причинно-следственных связей все еще очень ограничены и зависят от сильных предположений, будьте осторожны при применении их в контексте реального мира.

Карлос Синелли
источник
1
Есть ли шанс, что вы дополните свой ответ, чтобы как-нибудь включить несколько простых примеров с поддельными данными, пожалуйста? Например, прочитав немного элементов каузального вывода и просмотрев некоторые из лекций Петерса, и регрессионная основа обычно используется, чтобы мотивировать необходимость детального понимания проблемы (я даже не касаюсь их работы по ПМС). У меня сложилось впечатление (возможно, ошибочное), что в ваших усилиях по отказу от RCM ваши ответы не учитывают все реальные материальные механизмы моделирования.
usεr11852 говорит восстановить Monic
1
@ usεr11852 Я не уверен, что понимаю контекст ваших вопросов, вы хотите примеры причинных открытий? В той самой статье, которую предоставила Джейн, есть несколько примеров. Кроме того, я не уверен, что понимаю, что вы подразумеваете под «отказом от RCM и пропуском реального механизма материального моделирования», какой материальный механизм нам не хватает здесь в контексте причинного обнаружения?
Карлос Синелли
1
Извиняюсь за путаницу, мне нет дела до примеров из бумаг. Я могу цитировать другие документы сам. (Например, Лопес-Пас и др. CVPR 2017 об их коэффициенте нейронной причинности). Меня интересует простой числовой пример с фальшивыми данными, которые кто-то использует в R (или на вашем любимом языке), и посмотреть, что вы имеете в виду. Если вы приведете, например, Peters 'et al. книга, и у них есть небольшие фрагменты кода, которые чрезвычайно полезны (и иногда используют просто lm). Мы не можем все работать вокруг наблюдательных образцов наборов данных Тюбингена, чтобы получить представление о причинно-следственной связи! :)
usεr11852 говорит восстановить Monic
1
@ usεr11852 конечно, включая фальшивый пример, тривиально, я могу включить один, использующий лингам в R. Но не могли бы вы объяснить, что вы имели в виду, «избегая RCM и опуская реальные материальные механизмы моделирования»?
Карлос Синелли
2
@ usεr11852 хорошо, спасибо за отзыв, я постараюсь включить больше кода, когда это уместно. В качестве последнего замечания, результаты обнаружения причинно-следственных связей все еще очень ограничены, поэтому людям следует быть очень осторожными при их применении в зависимости от контекста.
Карлос Синелли
4

Существуют различные подходы к формализации причинности (что соответствует существенному философскому разногласию о причинности, существовавшему на протяжении веков). Популярный с точки зрения потенциальных результатов. Подход с потенциальными результатами, называемый моделью причинности Рубина , предполагает, что для каждого причинного состояния существует отдельная случайная величина. Таким образом, Y1 может быть случайной величиной возможных результатов клинического испытания, если пациент принимает исследуемый препарат, а Y2 может быть случайной величиной, если он принимает плацебо. Причинный эффект - это разница между Y1 и Y2 . Если на самом деле Y1=Y2 можно было бы сказать, что лечение не дает эффекта. В противном случае мы могли бы сказать, что состояние лечения приводит к результату.

Причинно-следственные связи между переменными также могут быть представлены с помощью ациклических диаграмм направленности , которые имеют очень разный вкус, но оказываются математически эквивалентными модели Рубина (Wasserman, 2004, раздел 17.8).

Вассерман Л. (2004). Вся статистика: краткий курс статистического вывода . Нью-Йорк, штат Нью-Йорк: Springer. ISBN 978-0-387-40272-7.

Kodiologist
источник
Спасибо. что будет тестом на это с учетом набора образцов из совместного распределения?
Джейн
3
Я читаю arxiv.org/abs/1804.04622 . Я не читал его ссылки. Я пытаюсь понять, что подразумевается под причинностью, основанной на данных наблюдений.
Джейн
1
Я извиняюсь (-1), это не то , спрашивается, вы не соблюдаете , ни Y 2 , вы замечаете образец фактических переменных X , Y . Смотрите статью, которую Джейн связала. Y1Y2XY
Карлос Синелли
2
@Vimal: я понимаю случай, когда у нас есть «интервенционные распределения». У нас нет «интервенционного распределения» в этой обстановке, и это делает его более сложным для понимания. В мотивирующем примере в статье они дают что-то вроде . Условное распределение y с учетом x по существу является распределением шума ϵ плюс некоторая трансляция, в то время как это не выполняется для условного распределения x с учетом y. Я инициативно понимаю пример. Я пытаюсь понять, каково общее определение для наблюдательного открытия причинности. (x,y=x3+ϵ)ϵ
Джейн
2
@ Джейн для наблюдательного случая (для вашего вопроса), в общем случае вы не можете определить направление причинности чисто математически, по крайней мере, для случая с двумя переменными. Для большего количества переменных при дополнительных (непроверяемых) допущениях вы могли бы сделать заявление, но заключение все еще может быть подвергнуто сомнению. Это обсуждение очень долго в комментариях. :)
Vimal
0

XY

  1. XY

Вмешательство - это хирургическое изменение переменной, которая не влияет на переменные, от которых она зависит. Вмешательства были строго формализованы в структурных уравнениях и причинно-следственных графических моделях, но, насколько мне известно, не существует определения, которое не зависит от конкретного класса моделей.

  1. Y requires the simulation of X

To make this rigorous requires formalizing a model over X and Y, and in particular the semantics which define how it is simulated.

In modern approaches to causation, intervention is taken as the primitive object which defines causal relationships (definition 1). In my opinion, however, intervention is a reflection of, and necessarily consistent with simulation dynamics.

zenna
источник