Требуется ли для линейной вероятностной модели регресс и быть нулевым / однозначным?

2

Как правило, зависимая переменная в линейной вероятностной модели (LPM) представляет собой двоичную переменную со значением 0/1. Что если зависимая переменная $ y_i $ все еще двоичная, но принимает общие значения $ a $ и $ b $, а не 0 и 1? Технически, результирующий предиктор все еще сохраняет свои хорошие свойства, например, это линейный предиктор минимальной среднеквадратичной ошибки (MMSE). Опять же, мы также можем преобразовать $ y_i $ в переменную 0/1; но иногда мы хотим сохранить исходные значения, скажем, для интерпретации.

Мой вопрос: можем ли мы назвать оценщик оценщиком LPM? Если нет, то как это назвать?

Fang Jing
источник

Ответы:

5

Метка «LPM» относится к структуре уравнения, а не к оценщику. Модели LPM могут оцениваться не только методом наименьших квадратов, но и, например, по методу максимальной вероятности.

Что касается природы зависимой переменной, мы говорим об аффинной трансформации здесь. Пусть модель будет иметь двоичную зависимую переменную и один регрессор для простоты,

$$ y_i = \ beta_0 + \ beta_1x_i + e_i $$

с $ y_i \ in \ {0,1 \} $. Затем нам говорят, что исходная переменная была

$$ z_i = a + (b-a) y_i $$

поэтому $ y_i = 0 \ означает z_i = a $, а $ y_i = 1 \ означает z_i = b $.

Тогда модель для $ z_i $

$$ z_i = a + (b-a) [\ beta_0 + \ beta_1x_i + e_i] $$

или же

$$ z_i = \ gamma_0 + \ gamma_1x_i + u_i $$

$$ \ gamma_0 = a + (b-a) \ beta_0, \; \; \; \ gamma_1 = (b-a) \ beta_1, \; \; \; u_i = (b-a) e_i $$

Структура модели остается прежней, уравнение линейное по параметрам, поэтому она все еще является моделью LPM.

Поскольку $ (a, b) $ являются предположительно известными значениями, после оценки $ z $ -модели и получения оценок для гамм мы можем восстановить оценки для бета-версий, если они представляют интерес.

Alecos Papadopoulos
источник
0

LPM - это модель, в которой вероятность двоичной зависимой переменной, имеющей конкретное значение, является линейной по параметрам. Например, если $ y $ является переменной с 0/1-значением и $ P (y = 1) = x \ beta $, это (уравнение для вероятности) называется линейной вероятностной моделью. Аналогично, если $ y \ in \ {-1, 1 \} $ и $ P (y = -1) = x \ beta $, это линейная вероятностная модель. Или, если $ y $ - это переменная, имеющая значение яблока / апельсина, и вы считаете, что вероятность того, что $ y $ будет яблоком, равна $ x \ beta $, ваша вера называется линейной вероятностной моделью. Ноль / один ничего не значат здесь; они всего лишь ярлыки. Вы можете пометить их как мужчина / женщина вместо этого, если хотите. Вы не теряете информацию от этой перемаркировки, пока помните новые метки. Кроме того, как сказал Пападопулус, это модель, а не оценщик, хотя мы просто понимаем «оценщик LPM» как оценщик параметров в LPM.

chan1142
источник