Я ссылаюсь на этот документ: Хейс JR, Groner JI. «Использование нескольких показателей вменения и склонности для проверки влияния автомобильных сидений и ремней безопасности на тяжесть травм на основании данных реестра травм». J Pediatr Surg. Май 2008 года; 43 (5): 924-7.
В этом исследовании была проведена множественная импутация для получения 15 полных наборов данных. Оценки склонности были затем рассчитаны для каждого набора данных. Затем для каждой наблюдательной единицы случайным образом выбиралась запись из одного из 15 законченных наборов данных (включая связанный показатель склонности), создавая тем самым один окончательный набор данных, для которого затем анализировалось сопоставлением показателей склонности.
Мои вопросы: Является ли это действительным способом сопоставления баллов предрасположенности после многократного вменения? Есть ли альтернативные способы сделать это?
Для контекста: в моем новом проекте я стремлюсь сравнить результаты двух методов лечения с использованием сопоставления баллов склонности. Отсутствуют данные, и я намереваюсь использовать MICE
пакет в R для вменения пропущенных значений, затем twang
для сопоставления показателей склонности, а затем lme4
для анализа сопоставленных данных.
Update1:
Я нашел эту статью, в которой используется другой подход: Митра, Робин и Райтер, Джером П. (2011) Сопоставление оценки склонности с отсутствующими ковариатами посредством повторного последовательного многократного вменения [Рабочий документ]
В этой статье авторы вычисляют оценки склонности по всем вмененным наборам данных, а затем объединяют их путем усреднения, что в духе множественного вменения использует правило Рубина для оценки баллов - но действительно ли оно применимо для оценки склонности?
Было бы очень хорошо, если бы кто-нибудь из CV мог дать ответ с комментариями по этим двум различным подходам и / или любым другим ....
источник
cobalt
пакета под названием «Использование кобальта со сложными данными». Вы можете получить к нему доступ здесь: CRAN.R-project.org/package=cobaltТам может быть столкновение двух парадигм. Множественное вменение - это байесовское решение в значительной степени основанное на модели: концепция правильного вменения в сущности утверждает, что вам необходимо выбрать из четко определенного апостериорного распределения данных, иначе вы облажались. Сопоставление оценки склонности, с другой стороны, является полупараметрической процедурой: как только вы вычислили свою оценку склонности (независимо от того, как, вы могли бы использовать оценку плотности ядра, не обязательно модель логита), вы можете сделать все остальное. просто взяв различия между обработанными и необработанными наблюдениями с одним и тем же показателем склонности, который сейчас является непараметрическим, так как не осталось модели, которая контролировала бы другие ковариаты. Я неAbadie и Imbens (2008) обсуждали, что это делает невозможным правильное исправление стандартных ошибок в некоторых подходящих ситуациях). Я бы больше доверял более плавным подходам, таким как взвешивание по обратной склонности. Мое любимое упоминание об этом - «В основном безвредная эконометрика» , с подзаголовком «Эмпирический компаньон», предназначенное для экономистов, но я думаю, что эта книга должна быть обязательной для чтения другими учеными-социологами, большинством биостатистиков и небио биографических статистиков, поэтому что они знают, как другие дисциплины подходят к анализу данных.
В любом случае, использование только одной из 15 смоделированных полных линий данных на одно наблюдение эквивалентно одному вменению. В результате вы теряете эффективность по сравнению со всеми 15 законченными наборами данных и не можете правильно оценить стандартные ошибки. Для меня это выглядит как неэффективная процедура с любой точки зрения.
Конечно, мы с радостью примем предположение, что и модель множественного вменения, и модель предрасположенности верны в том смысле, что все правильные переменные имеют правильные функциональные формы. Есть небольшой способ проверить это (хотя я был бы рад услышать иначе о диагностических мерах для обоих этих методов).
источник
Я не могу говорить о теоретических аспектах вопроса, но я поделюсь своим опытом использования моделей PS / IPTW и множественного вменения.
источник