Отсутствующие значения в переменной ответа в JAGS

10

Гельман и Хилл (2006) говорят:

В ошибках, пропущенные результаты в регрессии могут быть легко обработаны, просто включив вектор данных, NA и все. Ошибка явно моделирует выходную переменную, и поэтому тривиально использовать эту модель, чтобы влиять на пропущенные значения на каждой итерации.

Это звучит как простой способ использовать JAGS для прогнозирования. Но влияют ли наблюдения с отсутствующими результатами на оценки параметров? Если да, есть ли простой способ сохранить эти наблюдения в наборе данных, который видит JAGS, но не позволить им повлиять на оценки параметров? Я думал о функции вырезания, но она доступна только в сообщениях об ошибках, но не в JAGS.

Джек Таннер
источник

Ответы:

11

Да, это действительно легко использовать в ошибках или JAGS! На самом деле это приятно использовать!

Но влияют ли наблюдения с отсутствующими результатами на оценки параметров?

Конечно, нет. На параметры влияют только наблюдаемые результаты. Пропущенные результаты (НС) не повлияют ни на что, на самом деле это другой путь: пропущенные результаты будут получены из параметров. Обратите внимание, что отсутствующие результаты также будут иметь свое последующее распределение. Тогда очень легко вычислить некоторые производные величины, например, как сумму по индексам результата, и эти производные величины не только обрабатываются для пропущенных значений, но и сразу же имеют свое апостериорное распределение. Это то, что так сексуально на ЖУКАХ и ЯГОДАХ!

Радоваться, веселиться!

любознательный
источник
1
Извините, я не уверен, что пропущенные результаты не влияют на оценки параметров. Джекман, кажется, говорит обратное: jackman.stanford.edu/blog/?p=38
Джек Таннер
@JackTanner, подумай об этом немного. Как может отсутствующее значение повлиять на что-то? Когда алгоритм запускается, пропущенное значение начнет вменяться из оценок параметров (они получены из наблюдаемых результатов). Затем (возможно, я не уверен) информация от вмененного отсутствующего результата может отскочить назад к параметрам, но это не имеет значения - это просто исходная информация, присутствующая в параметрах, возвращенная к ним. РЕАЛЬНАЯ информация, которая влияет на что-то, исходит только из РЕАЛЬНЫХ результатов. Если вы мне не доверяете, сделайте симуляцию, сравните результаты и опубликуйте здесь.
любопытно
Что касается вашей ссылки, он, очевидно, не уверен в этом, он говорит «проблема» - в кавычках, и он говорит, что «было бы интересно сравнить это». Я говорю, что не будет существенной разницы. Если вы хотите проверить это, продолжайте.
любопытно
3
Согласен; нет существенной разницы. Я использую этот подход для построения апостериорных предсказательных распределений; просто поместите прогнозные значения переменных правой стороны вместе с прошлыми значениями и NA для целевой переменной "наблюдения", соответствующей прогнозным значениям.
jbowman
@jbowman, да, хорошая заметка! Не очевидная идея делать прогнозы таким образом!
любопытно