Каково математическое определение причинно-следственной связи между двумя случайными величинами?
Учитывая выборку из совместного распределения двух случайных величин и , когда мы скажем, что вызывает ?
Для контекста, я читаю эту статью о причинно-следственной связи .
Ответы:
Математически причинная модель состоит из функциональных отношений между переменными. Например, рассмотрим систему структурных уравнений ниже:
Это означает, чтоx функционально определяет значение y (если вы вмешиваетесь в x это меняет значения y ), но не наоборот. Графически это обычно представляется как x→y , что означает, что x входит в структурное уравнение y. В качестве дополнения вы также можете выразить причинную модель в терминах совместного распределения контрфактуальных переменных, что математически эквивалентно функциональным моделям .
Иногда (или в большинстве случаев) вы неfx fy знаете ни формы структурных уравнений f x , f y , ни даже x→y или y→x . Единственная имеющаяся у вас информация - это совместное распределение вероятностей p(y,x) (или выборки из этого распределения).
Это приводит к вашему вопросу: когда я могу восстановить направление причинности только из данных? Или, точнее, когда я могу восстановить, входит лиx в структурное уравнение y или наоборот, только из данных?
Конечно, без каких-либо принципиально непроверенных предположений о причинно-следственной модели это невозможно . Проблема состоит в том, что несколько различных причинных моделей могут повлечь за собой одно и то же совместное распределение вероятностей наблюдаемых переменных. Наиболее распространенным примером является причинно-следственная линейная система с гауссовским шумом.
Но при некоторых причинных предположениях это могло бы быть возможным - и это то, над чем работает литература по обнаружению причинно-следственных связей. Если вы не знакомы с этой темой ранее, вы можете начать с « Элементы причинно-следственной связи» Петерса, Янцинга и Шолкопфа, а также с главы 2 «Причинность » Иудеи Перл. У нас есть тема здесь, в резюме для ссылок на обнаружение причинно-следственной связи , но у нас пока не так много ссылок.
Поэтому на ваш вопрос не существует только одного ответа, поскольку он зависит от допущений, которые вы делаете. В упомянутой вами статье приводятся некоторые примеры, например, использование линейной модели с негауссовым шумом. Этот случай известен как LINGAN (сокращение от линейной негауссовой ациклической модели), вот пример в
R
:Обратите внимание, что здесь мы имеем линейную причинную модель с негауссовым шумом, гдеx2 вызывает x1 а лингам корректно восстанавливает причинное направление. Однако обратите внимание, что это критически зависит от предположений LINGAM.
Что касается цитируемой вами статьи, они делают это конкретное предположение (см. Их «постулат»):
Еслиx→y , минимальная длина описания механизма, отображающего X в Y, не зависит от значения X, тогда как минимальная длина описания механизма, отображающего Y в X, зависит от значения Y.
Обратите внимание, это предположение. Это то, что мы бы назвали их «условием идентификации». По существу, постулат накладывает ограничения на совместное распределениеp(x,y) . То есть постулат говорит, что если x→y в данных выполняются определенные ограничения, а если y→x другие ограничения выполняются. Эти типы ограничений, которые имеют проверяемые значения (накладывают ограничения на p(y,x) ), - это то, что позволяет направленно восстанавливаться из данных наблюдений.
Как последнее замечание, результаты обнаружения причинно-следственных связей все еще очень ограничены и зависят от сильных предположений, будьте осторожны при применении их в контексте реального мира.
источник
lm
). Мы не можем все работать вокруг наблюдательных образцов наборов данных Тюбингена, чтобы получить представление о причинно-следственной связи! :)Существуют различные подходы к формализации причинности (что соответствует существенному философскому разногласию о причинности, существовавшему на протяжении веков). Популярный с точки зрения потенциальных результатов. Подход с потенциальными результатами, называемый моделью причинности Рубина , предполагает, что для каждого причинного состояния существует отдельная случайная величина. Таким образом,Y1 может быть случайной величиной возможных результатов клинического испытания, если пациент принимает исследуемый препарат, а Y2 может быть случайной величиной, если он принимает плацебо. Причинный эффект - это разница между Y1 и Y2 . Если на самом деле Y1=Y2 можно было бы сказать, что лечение не дает эффекта. В противном случае мы могли бы сказать, что состояние лечения приводит к результату.
Причинно-следственные связи между переменными также могут быть представлены с помощью ациклических диаграмм направленности , которые имеют очень разный вкус, но оказываются математически эквивалентными модели Рубина (Wasserman, 2004, раздел 17.8).
Вассерман Л. (2004). Вся статистика: краткий курс статистического вывода . Нью-Йорк, штат Нью-Йорк: Springer. ISBN 978-0-387-40272-7.
источник
Вмешательство - это хирургическое изменение переменной, которая не влияет на переменные, от которых она зависит. Вмешательства были строго формализованы в структурных уравнениях и причинно-следственных графических моделях, но, насколько мне известно, не существует определения, которое не зависит от конкретного класса моделей.
To make this rigorous requires formalizing a model overX and Y , and in particular the semantics which define how it is simulated.
In modern approaches to causation, intervention is taken as the primitive object which defines causal relationships (definition 1). In my opinion, however, intervention is a reflection of, and necessarily consistent with simulation dynamics.
источник