Почему сопоставление оценки склонности работает для причинного вывода?

13

Сопоставление баллов склонности используется для определения причинно-следственных связей в наблюдательных исследованиях (см. Статью Розенбаума / Рубина ). Что за простая интуиция, почему она работает?

Другими словами, почему, если мы удостоверимся, что вероятность участия в лечении одинакова для двух групп, смешанные эффекты исчезнут, и мы можем использовать результат, чтобы сделать причинные выводы о лечении?

causality regression-strategies propensity-scores confounding Максимум
источник

8

Мое, вероятно, непопулярное мнение, но я думаю, что сказать, что PSM позволяет делать причинные выводы, немного его растягивает. Да, это более точный метод сопоставления, чем просто «грубое» сопоставление с несколькими переменными, но в конце концов, вы все равно сопоставляете только те переменные, которые вам доступны. Возможно, у вас еще есть эндогенное лечение, но вы предполагаете, что после сопоставления лечение является экзогенным. Но опять же, я никто, по сравнению с такими, как Рубин :)

Маркиз де Карабас

5

Есть те, кто не согласен с Розенбаумом и Рубином. Гэри Кинг довольно эффективно доказывал, что результаты сопоставления с использованием PSM уступают результатам, полученным при сопоставлении на основе расстояния Махаланобиса. См. Его статью здесь ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 Кроме того, этот вебинар предоставляет еще более убедительные доказательства ... method-colloquium.com/…

Майк Хантер,

4

Теоретически, вы МОЖЕТЕ сделать причинный вывод, применяя причинную модель Рубина, если все предположения будут выполнены. Но, конечно, дьявол всегда находится в деталях предположения, и для меня предположение о ненаблюдаемых противниках часто бывает жестким. На самом деле это невозможно доказать. Но вы можете по крайней мере выполнить анализ чувствительности, чтобы определить, что потребуется, чтобы ваши выводы изменились, если бы у вас были ненаблюдаемые собеседники.

StatsStudent

5

Хороший вопрос @DJohnson. Есть также такие, как Иудея Перл, Иэн Шриер и Арвид Шоландер, которые критически относятся к Рамке потенциальных результатов Рубина для причинного вывода из-за возможности введения «M-смещения» через то, что они называют «коллайдером». Они интересные чтения и должны дополнять любые чтения Рубина.

StatsStudent

12

Я постараюсь дать вам интуитивное понимание с минимальным акцентом на математике.

Основная проблема, связанная с данными наблюдений и вытекающими из этого анализами, вызывает недоумение. Смешение возникает, когда переменная влияет не только на назначенное лечение, но и на результаты. Когда проводится рандомизированный эксперимент, субъекты рандомизируются на лечение, так что в среднем субъекты, назначенные для каждого лечения, должны быть похожими по ковариатам (возраст, раса, пол и т. Д.). В результате этой рандомизации маловероятно (особенно в больших выборках), что различия в результате обусловлены какими-либо ковариатами, но обусловлены применяемым лечением, поскольку в среднем ковариаты в группах лечения одинаковы.

С другой стороны, с данными наблюдений не существует случайного механизма, который бы назначал субъектов для лечения. Возьмем, к примеру, исследование для изучения показателей выживаемости пациентов после новой операции на сердце по сравнению со стандартной хирургической процедурой. Как правило, по этическим причинам нельзя рандомизировать пациентов для каждой процедуры. В результате пациенты и врачи самостоятельно выбирают один из методов лечения, часто по ряду причин, связанных с их ковариатами. Например, новая процедура может быть несколько более рискованной, если вы старше, и в результате врачи могут рекомендовать новое лечение чаще молодым пациентам. Если это произойдет, и вы посмотрите на показатели выживаемости, новое лечение может показаться более эффективным, но это может ввести в заблуждение, поскольку более молодым пациентам было назначено это лечение, а более молодые пациенты, как правило, живут дольше, при прочих равных условиях Это где оценки склонности пригодятся.

Оценки склонности помогают решить фундаментальную проблему причинно-следственной связи: у вас могут возникнуть проблемы из-за нерандомизации субъектов к лечению, и это может быть причиной "эффектов", которые вы видите, а не только вмешательства или лечения. Если бы вы смогли как-то изменить свой анализ так, чтобы ковариаты (скажем, возраст, пол, пол, состояние здоровья) были «сбалансированы» между группами лечения, у вас были бы убедительные доказательства того, что разница в результатах обусловлена вмешательством / лечением а не эти ковариаты. Оценки склонности определяют вероятность того, что каждому субъекту будет назначено лечение, которое он получил с учетом набора наблюдаемых коваритов. Если вы затем сопоставите эти вероятности (оценки склонности),

Вы можете спросить, почему не совпадают точно по ковариатам (например, убедитесь, что вы соответствуете 40-летним мужчинам с хорошим здоровьем в лечении 1 и 40-летним мужчинам с хорошим здоровьем при лечении 2)? Это прекрасно работает для больших выборок и нескольких ковариат, но это становится практически невозможным, когда размер выборки небольшой, а число ковариат даже умеренного размера (см. Проклятие размерности на Перекрестной проверке, почему это так) ,

Теперь, несмотря на все сказанное, ахиллесова пята оценки склонности - это предположение об отсутствии незамеченных противников. Это предположение гласит, что вы не ошиблись, включив в свою настройку какие-либо ковариаты, являющиеся потенциальными препятствиями. Интуитивно понятно, что причина этого заключается в том, что, если вы не включили собеседника при создании показателя склонности, как вы можете приспособиться к нему? Существуют также дополнительные допущения, такие как допущение о стабильной стоимости единицы лечения, в котором говорится, что лечение, назначенное одному субъекту, не влияет на потенциальный исход других субъектов.

StatsStudent
источник

7

В строгом смысле корректировка показателя склонности не имеет ничего общего с причинно-следственной связью, чем регрессионное моделирование. Единственная реальная разница с оценками склонности состоит в том, что они облегчают настройку для большего количества наблюдаемых потенциальных факторов, которые могут привести к включению регрессионных моделей. Корректировка показателя предрасположенности (в большинстве случаев лучше всего выполнять ковариатную настройку с использованием сплайна в logit PS) можно рассматривать как метод сокращения данных, при котором сокращение происходит вдоль важной оси - смешанно. Тем не менее, он не обрабатывает неоднородность результатов (смещение восприимчивости), поэтому вам также необходимо корректировать ключевые важные ковариаты даже при использовании склонностей (см. Также вопросы, связанные с невозможностью сопоставления коэффициентов и коэффициентов опасности).

Сопоставление баллов предрасположенности может исключать многие наблюдения и, следовательно, быть крайне неэффективным. Я считаю любой метод, который исключает соответствующие наблюдения, проблематичным. Реальная проблема с сопоставлением состоит в том, что он исключает легко сопоставляемые наблюдения из-за некоторой предполагаемой необходимости сопоставления 1: 1, и большинство алгоритмов сопоставления зависят от порядка наблюдения.

Обратите внимание, что при выполнении стандартной регрессионной корректировки очень просто смешивать проверку и исключать неперекрывающиеся области. Пользователи показателя склонности учатся делать это, и единственная причина, по которой разработчики моделей регрессии этого не делают, заключается в том, что их этому не учат.

Анализ баллов склонности скрывает любые взаимодействия с воздействием, а сопоставление баллов склонности скрывает, кроме того, возможную связь между PS и эффектом лечения.

Анализ чувствительности (к неизмеренным спутникам) был разработан для PS, но его даже легче сделать с помощью стандартного регрессионного моделирования.

Если вы используете гибкие методы регрессии для оценки PS (например, не предполагайте, что непрерывные переменные действуют линейно), вам даже не нужно проверять баланс - должен быть баланс, или модель регрессии PS не была правильно указана в начале , Вам нужно только проверить, не перекрываются ли они. Это предполагает, что нет важных взаимодействий, которые были опущены в модели склонности. Соответствие делает то же самое предположение.

Фрэнк Харрелл
источник

3

Я рекомендую проверить Чаще всего Безвредную Эконометрику - у них есть хорошее объяснение этого на интуитивном уровне.

$x_i$ $y_{0i},y_{1i}$ $x$ $y_{0i},y_{1i}$ $x$ $y_{0i},y_{1i}$ коррелирует с лечением.

$x$ $x$ $x$ $x$ $x$

$x$ $x$ $x$ $x$

$y_{0i},y_{1i}$ $x_i$ $p(x_i)$ $p(x)$ $x$ $x$

$p(x)$ $x$ $x$ $x$ $y_{0i},y_{1i}$ не связаны с лечением. Это условие гарантирует, что средняя разность результатов по подвыборке между обработанным и необработанным является последовательной оценкой среднего эффекта лечения на этой подвыборке, т.е.

Е [Y_{я} | Обрабатывали, п (Икс)] - Е [Y_{я} | необработанный, п (Икс)]

$E[y_i|\text{Treated},p(x)] - E[y_i|\text{Untreated},p(x)]$

является последовательной оценкой локального среднего эффекта лечения.

Дальнейшее чтение:

Должны ли мы действительно использовать сопоставление баллов склонности на практике?

Связанный вопрос, сравнивающий сопоставление и регрессию

nfernand
источник

1

Это «работает» по той же причине, по которой регрессия «работает» - вы контролируете все смешанные факторы.

Вы можете осуществить такой аналитический контроль с помощью полностью определенной регрессионной модели с возможно большим количеством смешанных переменных или регрессионной модели только с одной переменной - показателем склонности (это может быть или не быть столь же сложной моделью, состоящей из тех же факторов). Вы можете придерживаться этой регрессии в сравнении с оценкой склонности, или вы можете сравнить ответ в аналогичных группах, где сходство определяется оценкой склонности. В духе вы делаете то же самое, но некоторые люди чувствуют, что последний метод лучше подчеркивает причинную задачу под рукой.

Обновить после обратной связи

Y (0), Y (1) ⊥ T | Икс \Rightarrow Y (0), Y (1) ⊥ T | п (Икс),

$Y(0), Y(1) \perp T \, | \, X \Rightarrow Y(0), Y(1) \perp T \, | \, p(X),$ и прочитайте об одном варианте сопоставления ближайшего соседа, называемом «сопоставлением штангенциркуля» (стр. 108), где показатели склонности к лечению и ближайший контрольный случай должны находиться в пределах некоторого максимального расстояния, что приводит к тому, что в некоторых случаях лечения нет совпадений. В этом случае метод по-прежнему будет работать, корректируя показатель склонности с использованием непараметрического аналога регрессии, но он также проясняет, что не может быть известно из одних данных (без модели для экстраполяции), и позволяет переопределить причинное количество с учетом имеющихся данных.

Бен Огорек
источник

1

Этот ответ обречен на неприязнь, потому что он удешевляет методы оценки склонности, сравнивая их с регрессией, грязным словом в причинных кругах. Но ведущий ответ признает, что «Ахиллесова пята оценки склонности - предположение об отсутствии ненаблюдаемых противников». Это довольно большая ахиллесова пята. Скажите, что предположение выполнено, и у меня есть набор данных со всеми противниками во вселенной. Помогите мне понять, почему регрессия не поможет раскрыть причинную истину, но совпадение показателей склонности поможет.

Бен Огорек

1

Причина, по которой регрессия часто проблематична, заключается в том, что результаты регрессии экстраполируются. С оценками склонности, во время ковариатных проверок баланса, гарантируется, что между группами лечения есть достаточное совпадение конфузоров. Это не обязательно относится к регрессии и может привести к неточным оценкам, поскольку нет стандартных диагностических проверок, которые бы указывали на то, что ваша регрессионная модель экстраполирует. Вот почему я обычно запускаю проверки баланса баллов склонности, даже если я просто использую регрессионную модель и не планирую использовать баллы склонности сами.

StatsStudent

Почему сопоставление оценки склонности работает для причинного вывода?

Ответы: