В «Книге причины» Иудеи Перл он говорит о том, что он называет Лестницей Причинности, которая, по сути, представляет собой иерархию, состоящую из разных уровней причинного мышления. Самый низкий уровень связан с паттернами ассоциации в наблюдаемых данных (например, корреляция, условная вероятность и т. Д.), Следующий фокусируется на вмешательстве (что произойдет, если мы намеренно изменим процесс генерирования данных каким-либо заранее заданным способом?), А третий - контрфактивный (что произойдет в другом возможном мире, если что-то произошло или не произошло)?
Что я не понимаю, так это то, как ступени два и три отличаются. Если мы задаем контрфактивный вопрос, разве мы не задаем вопрос о вмешательстве, чтобы свести на нет некоторые аспекты наблюдаемого мира?
Ответы:
Нет никакого противоречия между фактическим миром и действием интереса на интервенционном уровне. Например, курение до сегодняшнего дня и вынуждение бросить курить начиная с завтрашнего дня не противоречат друг другу, даже если можно сказать, что одно «отрицает» другое. Но теперь представьте следующий сценарий. Вы знаете Джо, курильщика на всю жизнь, у которого рак легких, и вы удивляетесь: а если бы Джо не курил в течение тридцати лет, он был бы здоров сегодня? В этом случае мы имеем дело с одним и тем же человеком, в то же время воображая сценарий, в котором действие и результат находятся в прямом противоречии с известными фактами.
Таким образом, основное различие между вмешательствами и контрфактуальностями заключается в том, что, в то время как в вмешательствах вы спрашиваете, что произойдет в среднем, если вы выполняете действие, в контрфактах вы спрашиваете, что произошло бы, если бы вы предприняли другой образ действий в конкретной ситуации. , учитывая, что у вас есть информация о том, что на самом деле произошло. Обратите внимание, что, поскольку вы уже знаете, что произошло в реальном мире, вам необходимо обновить информацию о прошлом в свете данных, которые вы наблюдали.
Эти два типа запросов математически различны, потому что они требуют разного уровня информации, на которую нужно ответить (контрафакты нуждаются в большем количестве информации, чтобы ответить) и еще более сложного языка, который будет сформулирован !.
Имея информацию, необходимую для ответа на вопросы по заданию 3, вы можете ответить на вопросы по заданию 2, но не наоборот. Точнее, вы не можете отвечать на контрфактические вопросы только с помощью интервенционной информации. Примеры, где происходит столкновение вмешательств и подделок, уже были приведены здесь в резюме, см. Этот пост и этот пост . Однако для полноты картины я приведу здесь также пример.
Пример ниже можно найти в Причинности, раздел 1.4.4.
На этот вопрос нельзя ответить только с помощью интервенционных данных, которые у вас есть. Доказательство простое: я могу создать две разные причинно-следственные модели, которые будут иметь одинаковые интервенционные распределения, но разные контрфактуальные распределения. Два приведены ниже:
Обратите внимание, что в первой модели лечение ни на кого не влияет, поэтому процент тех пациентов, которые умерли при лечении, которые могли бы выздороветь, если бы они не принимали лечение, равен нулю.
Однако во второй модели лечение оказывает влияние на каждого пациента, и мы имеем смесь двух групп населения, в которых средний причинный эффект оказывается равным нулю. В этом примере контрфактическое количество теперь достигает 100% - в модели 2 все пациенты, которые умерли под лечением, выздоровели бы, если бы не принимали лечение.
Таким образом, есть четкое различие между ступенью 2 и ступенью 3. Как показывает пример, вы не можете ответить на контрфактические вопросы только с помощью информации и предположений о вмешательствах. Это становится понятным с помощью трех шагов для вычисления контрфактуальности:
Это будет невозможно вычислить без некоторой функциональной информации о причинной модели или без некоторой информации о скрытых переменных.
источник
Вот ответ, который Иудея Перл дала в твиттере :
источник