Какие теории причинности я должен знать?

16

Какие теоретические подходы к причинности я должен знать как прикладной статистик / эконометрик?

Я знаю (очень немного)

Какие концепции мне не хватает или мне следует знать?

По теме: Какие теории являются основой причинности в машинном обучении?

Я прочитал эти интересные вопросы и ответы ( 1 , 2 , 3 ), но я думаю, что это другой вопрос. И я был очень удивлен, увидев, что «причинность», например, не упоминается в элементах статистического обучения .

Арне Йонас Варнке
источник
2
Посмотрите обзор Эндрю Гельмана нескольких работ о причинности в AJS: Гельман, А. (2011). Причинность и статистическое обучение. Американский журнал социологии, 117 (3), 955-966. doi: 10.1086 / 662659 . Это краткий обзор причинно-следственных связей в социальной науке с конкретными ссылками на работы Рубина и Перл, а также некоторые другие. Хорошее место, чтобы обыскивать ссылки.
Paqmo
1
Для начала (Джон Стюарт) методы Милля. ru.wikipedia.org/wiki/Mill's_Methods
ноуменал,
См. Мой комментарий под принятым ответом относительно возможного неверного толкования причинности Грейнджера.
Ричард Харди

Ответы:

17

B

Хотя это почти бесспорные, что причина должна предшествовать эффект во время, чтобы сделать причинные выводы со временем старшинства вы все еще должны требовать отсутствия путая, среди других источников ложных ассоциаций.

Что касается Потенциальных результатов (Неймана-Рубина) в сравнении с Причинно-следственными графиками / Моделированием структурных уравнений (Жемчужина), я бы сказал, что это ложная дилемма, и вы должны изучить оба.

Во-первых, важно отметить, что это не противоположные взгляды на причинность . Как говорит Перл, существует иерархия в отношении (причинных) задач вывода:

  1. Наблюдательный прогноз
  2. Прогноз под интервенцию
  3. Гипотезы

Для первого задания вам нужно только знать совместное распределение наблюдаемых переменных. Для второго задания вам необходимо знать совместное распределение и причинно-следственную структуру. Для выполнения последней задачи, связанной с контрафактом, вам также понадобится некоторая информация о функциональных формах модели структурного уравнения.

Таким образом, когда речь идет о контрафактах, существует формальная эквивалентность между обеими перспективами . Разница в том, что потенциальные результаты принимают контрфактуальные утверждения в качестве примитивов, а в DAG контрфакты кажутся производными от структурных уравнений. Тем не менее, вы можете спросить, если они "эквивалентны", зачем беспокоиться об изучении обоих? Потому что существуют различия в «легкости» выражения и извлечения вещей.

Например, попытайтесь выразить концепцию M-Bias, используя только потенциальные результаты - я никогда не видел хорошего. На самом деле, мой опыт показывает, что исследователи, которые никогда не изучали графики, даже не подозревают об этом. Кроме того, приведение основных предположений вашей модели к графическому языку облегчит вычисление ее эмпирических значений, поддающихся проверке, и ответит на вопросы идентификации. С другой стороны, иногда людям будет проще сначала подумать о самих контрфактуалах и объединить их с параметрическими допущениями, чтобы ответить на очень конкретные запросы.

Можно сказать гораздо больше, но суть в том, что вы должны научиться «говорить на обоих языках». Для справок, вы можете проверить, как начать здесь.

Карлос Синелли
источник
1
Не могли бы вы привести пример чего-то, что легко выразить в терминах PO, но не в DAG?
Гильерме Дуарте
@GuilhermeDuarte посреднические величины, включающие, например, вложенные контрфактуалы
Карлос Синелли
3
AGrangerBABB
@RichardHardy Я думаю, что вы правы, возможно, идеальный петух, который вороны всегда за час до восхода солнца, может иметь некоторую предсказательную силу за пределами линейной модели временных рядов восхода (так как восход солнца не всегда одинаков каждый день), но с идеальной моделью это, вероятно, ничего не добавляет.
Карлос Синелли
Я думаю, что причинно-следственная связь Грейнджера не предполагает использование низкокачественных прогностических моделей, имеющих только историю В, для обоснования необходимости дополнительной переменной А и, следовательно, причинности Грейнджера. Скорее, в идеале нужно стремиться к как можно более хорошей модели, используя собственную историю B, а затем посмотреть, поможет ли добавление A (в некоторой форме) предсказать B. И, конечно, «идеальный петух» является довольно утопической концепцией. Учитывая это, я думаю, что редактирование ответа для отражения этого может быть хорошей идеей.
Ричард Харди