Эконометрика: значима ли эластичность в моей или какой-либо регрессии?

13

Несколько месяцев назад я стажировался в этой организации; и, как уходящий подарок, я решил потратить мою последнюю неделю, в любое свободное время, чтобы исследовать факторы, которые влияют на зарплату учителей. Одна проблема, с которой я столкнулся с зарплатами учителей, состояла в том, что распределение для данного штата было искажено. У меня было много наблюдений, которые цеплялись за нижнюю границу спектра заработной платы. Я попытался решить эту проблему, включив сопоставимый индекс заработной платы в мою зависимую переменную (заработная плата учителя), но результаты, которые я нашел, были полностью устаревшими для объема моего проекта. Вместо этого я решил записать свою зависимую переменную. Это было хорошо, потому что теперь моя зарплата имела нормальное распределение, и она просто выглядела идеально на гистограмме. Когда я начал тестирование, я дошел до того, что остался с последней независимой переменной - декларацией о налоге на имущество. Проблема с моей нормативной заработной платой была также очевидна в моих наблюдениях за уплатой налога на недвижимость. У меня был огромный перекос номеров налоговых деклараций на недвижимость в нижней части спектра. Итак, я зарегистрировал эту переменную, и она все еще прошла тест на нулевую гипотезу.

Я не уверен, что это точно правильно, но сравнение изменения одной зарегистрированной переменной с другой зарегистрированной переменной дало мне эластичность. Предполагая, что это правильно, мое уравнение регрессии (что-то вроде LogWages = B0 + B1 (LogPropertyTaxReturns)) показывает эластичность между двумя переменными. Это имеет смысл, хотя? Если моя цель состояла в том, чтобы выяснить, какая переменная больше всего влияет на заработную плату учителей в каком-либо конкретном округе моего штата, то помогает ли показать эластичность между двумя переменными? Мы хотим поднять округа с самыми низкими зарплатами учителей выше, чтобы повысить их уровень жизни, но я боюсь, что я экстраполировал настолько далеко от реальных наблюдений, что мое заключительное уравнение регрессии не имеет смысла.

Редактировать: один из моих больших страхов заключается в том, что я должен был использовать нелинейную модель, чтобы показать отношения. Я чувствую, что принуждение как зависимой, так и независимой переменной к сотрудничеству в этой линейной регрессии в некотором смысле вводит в заблуждение.

rosenjcb
источник
1
Это абсолютно значимо. Посмотрите на определение упругости. В основном у вас есть информация о направлении отношений между заработной платой и PropertyTaxReturns. Более того, у вас есть приблизительный показатель этих отношений. Поскольку это Log-Log, заработная плата будет меняться на B1 процент за изменение в один процент от налога на имущество. Вы можете сделать анализ временных рядов, чтобы подтвердить это. На самом деле, просто увидеть график заработной платы и налога на имущество с течением времени будет достаточно, чтобы увидеть, каковы отношения. Это основной способ, который не учитывает скрытые переменные и т. Д.
Коба
@Koba Спасибо за комментарий так быстро. Разве проблема не в том, что эластичность изменяется вдоль кривой? Мое самое большое сожаление, что я, возможно, заставил модель быть линейной, заставляя эластичность быть довольно стабильной. Вспоминая, возможно, было бы лучше иметь нелинейную модель, отражающую этот перекос, о котором я говорил.
rosenjcb
Нет ничего плохого в преобразовании переменных с использованием log, квадратного корня, взаимных или других методов. Вы ничего не принуждаете. Вы используете преобразования, чтобы найти линейную связь между переменными. Иногда это просто, как если бы вы просто использовали y = b0 + b1 * x. В других случаях переменные линейно связаны более сложным образом, например, log (y) = b0 + b1 * (1 / x). Последняя функция может дать вам хорошие линейные отношения, но ее сложнее интерпретировать, поэтому чем меньше преобразования вы сможете использовать, тем лучше.
Коба
Функция log-log довольно проста log (y) = b0 + b1 * log (x). B1 - это именно процентное изменение y на одно процентное изменение x в вашем поперечном анализе. Опять же, если у вас есть эти данные в течение определенного периода времени, вы можете просто отобразить их график, чтобы увидеть взаимосвязь.
Коба
Я регистрировал переменные и делал другие преобразования для своих моделей регрессии. Я просто волновался, что эластичность дала повод для встречи. Хотя, оглядываясь назад, модель была линейной, она просто имела проблему наличия зависимых и независимых переменных с перекошенными распределениями.
rosenjcb

Ответы:

12

Ответ на вопрос - да, он действительно имеет смысл (по крайней мере, математически). Если вы оцениваете линейное уравнение

Wзнак равноβ0+β1пTр,

β1знак равноWпTрβ1пTрW

Lограмм(W)знак равноβ0+β1Lограмм(пTр),

β1знак равноWпTрпTрW

Вообще говоря, линейные преобразования влияют только на интерпретацию, данную коэффициентам, но действительность самой регрессии (в широком экономическом выражении) определяется предположениями модели и анализируемыми экономическими явлениями.

хань-tyumi
источник
8

Yзнак равноαИксβперYзнак равноперα+βперИкс

Я предполагаю, что ваш вопрос заключается в том, имеет ли смысл использовать эту функциональную форму в вашей конкретной модели. Сложно сказать. Как и в случае любой обычной линейной регрессии, вы делаете предположение о функциональной форме. По крайней мере, вы можете думать об этом как о линейном приближении, которое имеет больше смысла после преобразования log-log.

jmbejara
источник
7

ИксαβF

журналYязнак равноα+βжурналИкся+ΣJзнак равно2SγJχJ+λJχJжурналИкся
χJγλ

Обратите внимание, что в качестве представления «истинного» принятия базовых решений все преобразования, которые приводят к линейной регрессии, являются ошибочными. На самом деле все модели будут ошибаться. Вопрос на самом деле: полезна ли статистика, полученная из этой модели, для вашей проблемы ? Если ваше исследование сосредоточено на определении базовой модели, это момент, который говорит вам что-то интересное об этой более глубокой модели? Если вы в большей степени ориентированы на политику, приблизит ли аппроксимация с постоянной эластичностью вас к истине, что дальнейшие улучшения не имеют значения? Либо чрезвычайно сложные вопросы, на которые нужно ответить как стороннему наблюдателю. Но если единственная альтернатива, о которой вы беспокоитесь, это переменная эластичность, то тест, который я описал выше, может дать вам некоторое спокойствие.

jayk
источник
4

Другие ответы касались основных вопросов, я хотел бы ответить на «Правку», сделанную ФП в вопросе:

Редактировать: один из моих больших страхов заключается в том, что я должен был использовать нелинейную модель, чтобы показать отношения. Я чувствую, что принуждение как зависимой, так и независимой переменной к сотрудничеству в этой линейной регрессии в некотором смысле вводит в заблуждение.

Мы склонны забывать, что «преобразование переменной» приводит к новой переменной , поведение которой может быть совершенно отличным от «первоначальной». Самый простой пример - сравнить графики переменной и ее квадрата.

Таким образом , с учетом натуральных логарифмов вашего переменными, больше не рассматривать в отношениях между ними , но в связи между некоторой функцией из них.
К счастью , математическое понятие «логарифм» может быть связано с понятием «эластичность», которое описывает отношение между процентными изменениями, которое мы понимаем с экономической точки зрения и можем осмысленно интерпретировать и использовать.

Если можно разумно сказать, что переменные демонстрируют «линейные отношения в логарифмах», это означает, что их уровни (то есть фактические переменные) имеют нелинейные отношения:

перYa+бперИксYеa+Иксб

Так почему бы не оценить нелинейную модель?
В (математическом) принципе нет причин, почему бы и нет. Некоторые практические вопросы:

1) Существует слишком много форм нелинейных отношений, есть только одна линейная связь (структурно говоря). Это вопрос «затрат на поиск» для наиболее подходящей спецификации.

2) Полученные нелинейные отношения могут не иметь четкого экономического объяснения. Почему это проблема? Потому что мы не раскрываем здесь «законы природы», неизменные во времени и пространстве. Мы приближаем социальный феномен. Наличие аппроксимации, которая, кроме того, может быть представлена только в виде математической формулы, без экономических обоснований, которые ее подтверждают и подтверждают, делают результат очень слабым.

3) Нелинейная оценка менее стабильна с точки зрения механики алгоритма оценки.

Алекос Пападопулос
источник
3

Я бы сказал, что ваша модель в этом случае не имеет смысла, если ваша « цель состояла в том, чтобы выяснить, какая переменная больше всего повлияла на зарплату учителей в любом конкретном округе моего штата ». Вы только что показали, какова взаимосвязь (журналы) заработной платы и налоговых деклараций на недвижимость. Вы должны по крайней мере использовать множественную регрессию.

Конечно, вы могли бы продолжать и разрабатывать полноценную, правильную стратегию идентификации с соответствующими методологическими инструментами, чтобы оценить интенсивность каждого причинного эффекта и найти самый большой ... В действительности вы, скорее всего, не сможете сделать это с учетом сложности такой задачи. Это просто континуум уточнений, и вы близки к самой грубой из возможных моделей, используемых для объяснения заработной платы, очень далеко от того, что я бы посчитал приемлемым приближением ответа на вопрос, скрытый в вашей цели. Вы должны попытаться заручиться помощью экономиста.

S_A
источник