Сопоставление баллов склонности используется для определения причинно-следственных связей в наблюдательных исследованиях (см. Статью Розенбаума / Рубина ). Что за простая интуиция, почему она работает?
Другими словами, почему, если мы удостоверимся, что вероятность участия в лечении одинакова для двух групп, смешанные эффекты исчезнут, и мы можем использовать результат, чтобы сделать причинные выводы о лечении?
Ответы:
Я постараюсь дать вам интуитивное понимание с минимальным акцентом на математике.
Основная проблема, связанная с данными наблюдений и вытекающими из этого анализами, вызывает недоумение. Смешение возникает, когда переменная влияет не только на назначенное лечение, но и на результаты. Когда проводится рандомизированный эксперимент, субъекты рандомизируются на лечение, так что в среднем субъекты, назначенные для каждого лечения, должны быть похожими по ковариатам (возраст, раса, пол и т. Д.). В результате этой рандомизации маловероятно (особенно в больших выборках), что различия в результате обусловлены какими-либо ковариатами, но обусловлены применяемым лечением, поскольку в среднем ковариаты в группах лечения одинаковы.
С другой стороны, с данными наблюдений не существует случайного механизма, который бы назначал субъектов для лечения. Возьмем, к примеру, исследование для изучения показателей выживаемости пациентов после новой операции на сердце по сравнению со стандартной хирургической процедурой. Как правило, по этическим причинам нельзя рандомизировать пациентов для каждой процедуры. В результате пациенты и врачи самостоятельно выбирают один из методов лечения, часто по ряду причин, связанных с их ковариатами. Например, новая процедура может быть несколько более рискованной, если вы старше, и в результате врачи могут рекомендовать новое лечение чаще молодым пациентам. Если это произойдет, и вы посмотрите на показатели выживаемости, новое лечение может показаться более эффективным, но это может ввести в заблуждение, поскольку более молодым пациентам было назначено это лечение, а более молодые пациенты, как правило, живут дольше, при прочих равных условиях Это где оценки склонности пригодятся.
Оценки склонности помогают решить фундаментальную проблему причинно-следственной связи: у вас могут возникнуть проблемы из-за нерандомизации субъектов к лечению, и это может быть причиной "эффектов", которые вы видите, а не только вмешательства или лечения. Если бы вы смогли как-то изменить свой анализ так, чтобы ковариаты (скажем, возраст, пол, пол, состояние здоровья) были «сбалансированы» между группами лечения, у вас были бы убедительные доказательства того, что разница в результатах обусловлена вмешательством / лечением а не эти ковариаты. Оценки склонности определяют вероятность того, что каждому субъекту будет назначено лечение, которое он получил с учетом набора наблюдаемых коваритов. Если вы затем сопоставите эти вероятности (оценки склонности),
Вы можете спросить, почему не совпадают точно по ковариатам (например, убедитесь, что вы соответствуете 40-летним мужчинам с хорошим здоровьем в лечении 1 и 40-летним мужчинам с хорошим здоровьем при лечении 2)? Это прекрасно работает для больших выборок и нескольких ковариат, но это становится практически невозможным, когда размер выборки небольшой, а число ковариат даже умеренного размера (см. Проклятие размерности на Перекрестной проверке, почему это так) ,
Теперь, несмотря на все сказанное, ахиллесова пята оценки склонности - это предположение об отсутствии незамеченных противников. Это предположение гласит, что вы не ошиблись, включив в свою настройку какие-либо ковариаты, являющиеся потенциальными препятствиями. Интуитивно понятно, что причина этого заключается в том, что, если вы не включили собеседника при создании показателя склонности, как вы можете приспособиться к нему? Существуют также дополнительные допущения, такие как допущение о стабильной стоимости единицы лечения, в котором говорится, что лечение, назначенное одному субъекту, не влияет на потенциальный исход других субъектов.
источник
В строгом смысле корректировка показателя склонности не имеет ничего общего с причинно-следственной связью, чем регрессионное моделирование. Единственная реальная разница с оценками склонности состоит в том, что они облегчают настройку для большего количества наблюдаемых потенциальных факторов, которые могут привести к включению регрессионных моделей. Корректировка показателя предрасположенности (в большинстве случаев лучше всего выполнять ковариатную настройку с использованием сплайна в logit PS) можно рассматривать как метод сокращения данных, при котором сокращение происходит вдоль важной оси - смешанно. Тем не менее, он не обрабатывает неоднородность результатов (смещение восприимчивости), поэтому вам также необходимо корректировать ключевые важные ковариаты даже при использовании склонностей (см. Также вопросы, связанные с невозможностью сопоставления коэффициентов и коэффициентов опасности).
Сопоставление баллов предрасположенности может исключать многие наблюдения и, следовательно, быть крайне неэффективным. Я считаю любой метод, который исключает соответствующие наблюдения, проблематичным. Реальная проблема с сопоставлением состоит в том, что он исключает легко сопоставляемые наблюдения из-за некоторой предполагаемой необходимости сопоставления 1: 1, и большинство алгоритмов сопоставления зависят от порядка наблюдения.
Обратите внимание, что при выполнении стандартной регрессионной корректировки очень просто смешивать проверку и исключать неперекрывающиеся области. Пользователи показателя склонности учатся делать это, и единственная причина, по которой разработчики моделей регрессии этого не делают, заключается в том, что их этому не учат.
Анализ баллов склонности скрывает любые взаимодействия с воздействием, а сопоставление баллов склонности скрывает, кроме того, возможную связь между PS и эффектом лечения.
Анализ чувствительности (к неизмеренным спутникам) был разработан для PS, но его даже легче сделать с помощью стандартного регрессионного моделирования.
Если вы используете гибкие методы регрессии для оценки PS (например, не предполагайте, что непрерывные переменные действуют линейно), вам даже не нужно проверять баланс - должен быть баланс, или модель регрессии PS не была правильно указана в начале , Вам нужно только проверить, не перекрываются ли они. Это предполагает, что нет важных взаимодействий, которые были опущены в модели склонности. Соответствие делает то же самое предположение.
источник
Я рекомендую проверить Чаще всего Безвредную Эконометрику - у них есть хорошее объяснение этого на интуитивном уровне.
является последовательной оценкой локального среднего эффекта лечения.
Дальнейшее чтение:
Должны ли мы действительно использовать сопоставление баллов склонности на практике?
Связанный вопрос, сравнивающий сопоставление и регрессию
источник
Это «работает» по той же причине, по которой регрессия «работает» - вы контролируете все смешанные факторы.
Вы можете осуществить такой аналитический контроль с помощью полностью определенной регрессионной модели с возможно большим количеством смешанных переменных или регрессионной модели только с одной переменной - показателем склонности (это может быть или не быть столь же сложной моделью, состоящей из тех же факторов). Вы можете придерживаться этой регрессии в сравнении с оценкой склонности, или вы можете сравнить ответ в аналогичных группах, где сходство определяется оценкой склонности. В духе вы делаете то же самое, но некоторые люди чувствуют, что последний метод лучше подчеркивает причинную задачу под рукой.
Обновить после обратной связи
источник