Каковы предположения для применения регрессионной модели Тобита?

9

Мои (очень базовые) знания о модели регрессии Тобита не из класса, как я бы предпочел. Вместо этого я собрал фрагменты информации здесь и там через несколько поисков в Интернете. Мое лучшее предположение в отношении усеченной регрессии состоит в том, что они очень похожи на предположения обычных наименьших квадратов (OLS). Я понятия не имею, если это правильно, хотя.

Отсюда мой вопрос: какие предположения я должен проверить при выполнении регрессии Тобита?

Примечание: оригинальная форма этого вопроса относилась к усеченной регрессии, которая не была моделью, которую я использовал или спрашивал. Я исправил вопрос.

Firefeather
источник
1
Вы не должны использовать усеченную регрессию только потому, что у вас есть искаженные или ограниченные данные. Это специально для ситуаций, когда возможны значения ниже порогового значения (например, отрицательные значения), но по какой-то причине они не наблюдаются. Это ситуация у вас?
Анико
@Aniko, отрицательные значения зависимой переменной на самом деле не имеют смысла (это означало бы получать оплату за получение услуги), но я слышал, что Вулдридж (в эконометрическом анализе поперечных сечений и панельных данных , 2002) рекомендовал усечь или регрессионные модели с цензурой вместо OLS, когда но является непрерывной случайной величиной для положительных значений. YP(Y=0)>0Y
Firefeather
Огромная ошибка; Я понял, что все время имел в виду регрессию Тобита , а не Усеченную регрессию. Я просто изменил вопрос, чтобы отразить эту ошибку.
Firefeather
Ссылка Вулдриджа - все еще правильная ссылка; то есть это относится к регрессии Тобита.
Firefeather
Анико права, этот тобит может быть не лучшим выбором. Посмотрите на следующее, чтобы узнать об альтернативах: ideas.repec.org/p/boc/bost10/2.html

Ответы:

6

Если перейти к простому ответу, очень уместна выдержка из книги Вулдриджа (стр. 533):

... и гетероскедастичность, и ненормальность приводят к тому, что оценка Тобита непоследовательна для . Это несоответствие возникает из-за того, что производная плотность заданного зависит от . Эта ненадежность оценки Tobit показывает, что цензура данных может быть очень дорогостоящей: в отсутствие цензуры ( ) можно было бы последовательно оценить при [или даже ]. ; & betaуху*| xNormal(xβ,σ2)y=yβE(u|x)=0E(xu)=0β^βyxy|xNormal(xβ,σ2)y=yβE(u|x)=0E(xu)=0

Обозначения в этом отрывке взяты из модели Tobit:

y=xβ+u,u|xN(0,σ2)y=max(y,0)
где наблюдаются и .yx

Подводя итог разнице между наименьшими квадратами и регрессией Тобита, присуще предположение нормальности последнего.

Также я всегда думал, что оригинальная статья Амемии была довольно хороша в изложении теоретических основ регрессии Тобита.

mpiktas
источник
Вот Это Да! Спасибо, что нашли доступную для просмотра ссылку - я не думал заглянуть в Google Книги, когда искал копию книги Вулдриджа.
Firefeather
4

Повторяя комментарий Анико: Первичное предположение - это усечение. Это не то же самое предположение, что и две другие возможности, которые предлагает мне ваш пост: ограниченность и выборка.

Если у вас есть фундаментально ограниченная зависимая переменная, а не усеченная, вы можете перейти к обобщенной линейной модели структуры с одним из (реже выбираемых) распределений для Y, например, log-normal, gamma, exponential и т. Д., Которые учитывают нижняя граница.

В качестве альтернативы вы можете спросить себя, считаете ли вы, что процесс, который генерирует нулевые наблюдения в вашей модели, совпадает с процессом, который генерирует строго положительные значения - цены в вашем приложении, я думаю. Если это не так, тогда может подойти что-то из класса моделей отбора образцов (например, модели Хекмана). В этом случае вы оказались бы в ситуации, когда указали бы одну модель готовности платить любую цену вообще, а другую модель - какую цену заплатили бы ваши субъекты, если бы они хотели что-то заплатить.

Короче говоря, вы, вероятно, захотите рассмотреть разницу между допущением усеченных, цензурированных, ограниченных и выборочных зависимых переменных. Какой из них вы хотите получить из деталей вашей заявки. Как только это первое самое важное предположение будет сделано, вам будет легче определить, нравятся ли вам конкретные предположения какой-либо модели в выбранном вами классе. Некоторые из моделей выборки имеют предположения, которые довольно сложно проверить ...

conjugateprior
источник
3

@Firefeather: Ваши данные содержат (и могут только содержать) только положительные значения? Если это так, смоделируйте его, используя обобщенную линейную модель с гамма-ошибкой и лог-связью. Если он содержит нули, вы можете рассмотреть два этапа (логистическая регрессия для вероятности нуля и гамма-регрессия для положительных значений). Этот последний сценарий также может быть смоделирован как единая регрессия с использованием гаммы с завышенной нуля. Несколько замечательных объяснений этому было дано в списке SAS несколько лет назад. Начните здесь, если вы заинтересованы, и ищите продолжение. текст ссылки

Может помочь направить вас в другом направлении, если усеченная регрессия окажется неправдоподобной.

B_Miner
источник
2

Как уже упоминали другие, основное применение регрессии тобитов - это цензура данных. Тобит широко используется в сочетании с анализом охвата данных (DEA) и экономистом. В DEA показатель эффективности находится в диапазоне от 0 до 1, что означает, что зависимая переменная подвергается цензуре при 0 слева и 1 справа. Поэтому применение линейной регрессии (OLS) неосуществимо.

Тобит представляет собой комбинацию пробита и усеченной регрессии. Необходимо соблюдать осторожность при дифференциации цензуры и усечения:

  • Цензура: когда предельные наблюдения находятся в выборке. Значения зависимых переменных достигают предела влево или вправо.
  • Усечение: наблюдение, при котором определенный диапазон зависимых значений не включен в исследование. Например, только положительные значения. Усечение приводит к большей потере информации, чем цензура.

Тобит = пробит + усечение регрессии

Тобитная модель предполагает нормальность, как и пробитная модель.

шаги:

  1. Пробит-модель решает, является ли зависимая переменная 0 или 1. Если зависимая переменная равна 1, то насколько (при условии цензуры в 0) ,

    (Discreet decision)P(y>0)=Φ(xβ)
  2. (Continuous decision)E(yy>0)=xβ+σλ(xβσ)

Коэффициент одинаков для обеих моделей принятия решений. - это поправочный член для корректировки цензурированных значений (нулей). βσλ(xβσ)

Пожалуйста, также проверьте модель Крэгга, где вы можете использовать разные на каждом шаге.β

Амар Наяк
источник
Добро пожаловать на сайт, @ Amarnayak. Я отредактировал ваше сообщение, чтобы использовать форматирование типа . Пожалуйста, убедитесь, что он по-прежнему говорит, что вы хотите. LATEX
gung - Восстановить Монику