Мои (очень базовые) знания о модели регрессии Тобита не из класса, как я бы предпочел. Вместо этого я собрал фрагменты информации здесь и там через несколько поисков в Интернете. Мое лучшее предположение в отношении усеченной регрессии состоит в том, что они очень похожи на предположения обычных наименьших квадратов (OLS). Я понятия не имею, если это правильно, хотя.
Отсюда мой вопрос: какие предположения я должен проверить при выполнении регрессии Тобита?
Примечание: оригинальная форма этого вопроса относилась к усеченной регрессии, которая не была моделью, которую я использовал или спрашивал. Я исправил вопрос.
regression
assumptions
Firefeather
источник
источник
Ответы:
Если перейти к простому ответу, очень уместна выдержка из книги Вулдриджа (стр. 533):
... и гетероскедастичность, и ненормальность приводят к тому, что оценка Тобита непоследовательна для . Это несоответствие возникает из-за того, что производная плотность заданного зависит от . Эта ненадежность оценки Tobit показывает, что цензура данных может быть очень дорогостоящей: в отсутствие цензуры ( ) можно было бы последовательно оценить при [или даже ]. ; & betaуху*| x∼Normal(xβ,σ2)y=y∗βE(u|x)=0E(x′u)=0β^ β y x y∗|x∼Normal(xβ,σ2) y=y∗ β E(u|x)=0 E(x′u)=0
Обозначения в этом отрывке взяты из модели Tobit:
Подводя итог разнице между наименьшими квадратами и регрессией Тобита, присуще предположение нормальности последнего.
Также я всегда думал, что оригинальная статья Амемии была довольно хороша в изложении теоретических основ регрессии Тобита.
источник
Повторяя комментарий Анико: Первичное предположение - это усечение. Это не то же самое предположение, что и две другие возможности, которые предлагает мне ваш пост: ограниченность и выборка.
Если у вас есть фундаментально ограниченная зависимая переменная, а не усеченная, вы можете перейти к обобщенной линейной модели структуры с одним из (реже выбираемых) распределений для Y, например, log-normal, gamma, exponential и т. Д., Которые учитывают нижняя граница.
В качестве альтернативы вы можете спросить себя, считаете ли вы, что процесс, который генерирует нулевые наблюдения в вашей модели, совпадает с процессом, который генерирует строго положительные значения - цены в вашем приложении, я думаю. Если это не так, тогда может подойти что-то из класса моделей отбора образцов (например, модели Хекмана). В этом случае вы оказались бы в ситуации, когда указали бы одну модель готовности платить любую цену вообще, а другую модель - какую цену заплатили бы ваши субъекты, если бы они хотели что-то заплатить.
Короче говоря, вы, вероятно, захотите рассмотреть разницу между допущением усеченных, цензурированных, ограниченных и выборочных зависимых переменных. Какой из них вы хотите получить из деталей вашей заявки. Как только это первое самое важное предположение будет сделано, вам будет легче определить, нравятся ли вам конкретные предположения какой-либо модели в выбранном вами классе. Некоторые из моделей выборки имеют предположения, которые довольно сложно проверить ...
источник
@Firefeather: Ваши данные содержат (и могут только содержать) только положительные значения? Если это так, смоделируйте его, используя обобщенную линейную модель с гамма-ошибкой и лог-связью. Если он содержит нули, вы можете рассмотреть два этапа (логистическая регрессия для вероятности нуля и гамма-регрессия для положительных значений). Этот последний сценарий также может быть смоделирован как единая регрессия с использованием гаммы с завышенной нуля. Несколько замечательных объяснений этому было дано в списке SAS несколько лет назад. Начните здесь, если вы заинтересованы, и ищите продолжение. текст ссылки
Может помочь направить вас в другом направлении, если усеченная регрессия окажется неправдоподобной.
источник
Как уже упоминали другие, основное применение регрессии тобитов - это цензура данных. Тобит широко используется в сочетании с анализом охвата данных (DEA) и экономистом. В DEA показатель эффективности находится в диапазоне от 0 до 1, что означает, что зависимая переменная подвергается цензуре при 0 слева и 1 справа. Поэтому применение линейной регрессии (OLS) неосуществимо.
Тобит представляет собой комбинацию пробита и усеченной регрессии. Необходимо соблюдать осторожность при дифференциации цензуры и усечения:
Тобит = пробит + усечение регрессии
Тобитная модель предполагает нормальность, как и пробитная модель.
шаги:
Пробит-модель решает, является ли зависимая переменная 0 или 1. Если зависимая переменная равна 1, то насколько (при условии цензуры в 0) ,
Коэффициент одинаков для обеих моделей принятия решений. - это поправочный член для корректировки цензурированных значений (нулей).β σλ(x′βσ)
Пожалуйста, также проверьте модель Крэгга, где вы можете использовать разные на каждом шаге.β
источник