В настоящее время я читаю статью Перла (Pearl, 2009, 2-е издание) о причинности и борьбе за установление связи между непараметрической идентификацией модели и фактической оценкой. К сожалению, сам Перл очень молчит на эту тему.
Чтобы привести пример, я имею в виду простую модель с причинным путем, , и механизмом, влияющим на все переменные , и . Кроме того, и связаны с ненаблюдаемыми влияниями, . По правилам do-исчисления теперь я знаю, что пост-интервенционное (дискретное) распределение вероятностей определяется как:w → x w → z w → y x y x ← → y
Мне интересно, как я могу оценить эту величину (непараметрически или введя параметрические предположения)? Особенно для случая, когда представляет собой набор из нескольких смешанных переменных и представляющие интерес количества являются непрерывными. Оценка совместного распределения данных перед вмешательством представляется в этом случае очень непрактичной. Кто-нибудь знает применение методов Перла, которые занимаются этими проблемами? Я был бы очень рад за указатель.
Ответы:
Это очень хороший вопрос. Сначала давайте проверим правильность вашей формулы. Информация, которую вы предоставили, соответствует следующей причинно-следственной модели:
И, как вы сказали, мы можем получить оценку для используя правила do-исчисления. В R мы можем легко сделать это с пакетом . Сначала мы загружаемся, чтобы создать объект с причинной диаграммой, которую вы предлагаете:п( Y| do ( X) )
causaleffect
igraph
Где первые два слагаемыхИкс Y
X-+Y, Y-+X
представляют ненаблюдаемые составители и а остальные слагаемые обозначают указанные вами ребра.YЗатем мы просим нашу оценку:
Что действительно совпадает с вашей формулой - случай входной двери с наблюдаемым спутником.
Теперь перейдем к части оценки. Если вы предполагаете линейность (и нормальность), все значительно упрощается. В основном то , что вы хотите сделать , это оценить коэффициенты пути .Икс→ Z→ Y
Давайте смоделируем некоторые данные:
Y Y ∼ Z + W + X Z Y Z ∼ X + W XИкс Y Y∼ Z+ W+ X Z Y Z∼ X+ W Икс Z
А для вывода вы можете вычислить (асимптотическую) стандартную ошибку продукта:
Что вы можете использовать для тестов или доверительных интервалов:
Вы также можете выполнить (не / полу) -параметрическую оценку, я постараюсь обновить этот ответ, включая другие процедуры позже.
источник