Какие теоретические подходы к причинности я должен знать как прикладной статистик / эконометрик?
Я знаю (очень немного)
- Причинно-следственная модель Неймана – Рубина (и Рой , Гавелмо и т. Д.)
- Работа Перла о причинности
- Причинность Грейнджера (хотя и менее ориентированная на лечение)
Какие концепции мне не хватает или мне следует знать?
По теме: Какие теории являются основой причинности в машинном обучении?
Я прочитал эти интересные вопросы и ответы ( 1 , 2 , 3 ), но я думаю, что это другой вопрос. И я был очень удивлен, увидев, что «причинность», например, не упоминается в элементах статистического обучения .
machine-learning
causality
theory
treatment-effect
Арне Йонас Варнке
источник
источник
Ответы:
Хотя это почти бесспорные, что причина должна предшествовать эффект во время, чтобы сделать причинные выводы со временем старшинства вы все еще должны требовать отсутствия путая, среди других источников ложных ассоциаций.
Что касается Потенциальных результатов (Неймана-Рубина) в сравнении с Причинно-следственными графиками / Моделированием структурных уравнений (Жемчужина), я бы сказал, что это ложная дилемма, и вы должны изучить оба.
Во-первых, важно отметить, что это не противоположные взгляды на причинность . Как говорит Перл, существует иерархия в отношении (причинных) задач вывода:
Для первого задания вам нужно только знать совместное распределение наблюдаемых переменных. Для второго задания вам необходимо знать совместное распределение и причинно-следственную структуру. Для выполнения последней задачи, связанной с контрафактом, вам также понадобится некоторая информация о функциональных формах модели структурного уравнения.
Таким образом, когда речь идет о контрафактах, существует формальная эквивалентность между обеими перспективами . Разница в том, что потенциальные результаты принимают контрфактуальные утверждения в качестве примитивов, а в DAG контрфакты кажутся производными от структурных уравнений. Тем не менее, вы можете спросить, если они "эквивалентны", зачем беспокоиться об изучении обоих? Потому что существуют различия в «легкости» выражения и извлечения вещей.
Например, попытайтесь выразить концепцию M-Bias, используя только потенциальные результаты - я никогда не видел хорошего. На самом деле, мой опыт показывает, что исследователи, которые никогда не изучали графики, даже не подозревают об этом. Кроме того, приведение основных предположений вашей модели к графическому языку облегчит вычисление ее эмпирических значений, поддающихся проверке, и ответит на вопросы идентификации. С другой стороны, иногда людям будет проще сначала подумать о самих контрфактуалах и объединить их с параметрическими допущениями, чтобы ответить на очень конкретные запросы.
Можно сказать гораздо больше, но суть в том, что вы должны научиться «говорить на обоих языках». Для справок, вы можете проверить, как начать здесь.
источник