Вопрос о предельных эффектах (от X на Y), я думаю, не столько о интерпретации отдельных коэффициентов. Как уже отметили люди, их можно отождествить только с размером эффекта, например, когда существуют линейные и аддитивные отношения.
Если это в центре внимания, то (концептуально, если не практически) простейший способ осмыслить проблему будет выглядеть так:
Чтобы получить предельное влияние X на Y в модели линейной нормальной регрессии без взаимодействий, вы можете просто посмотреть на коэффициент на X. Но этого недостаточно, поскольку он оценивается как неизвестный. В любом случае, что действительно нужно для предельных эффектов, это какой-то график или резюме, которое обеспечивает прогноз Y для диапазона значений X и меру неопределенности. Обычно может потребоваться прогнозируемое среднее значение Y и доверительный интервал, но может также потребоваться прогнозирование полного условного распределения Y для X. Это распределение шире, чем сигма-оценка подобранной модели, поскольку она учитывает неопределенность в отношении коэффициентов модели. ,
Существуют различные решения для закрытых форм для простых моделей, подобных этой. Для текущих целей мы можем их игнорировать и вместо этого думать более широко о том, как получить этот граф предельных эффектов путем моделирования, таким образом, чтобы иметь дело со сколь угодно сложными моделями.
Предположим, вы хотите, чтобы влияние X изменялось на среднее значение Y, и вы готовы исправить все остальные переменные в значимых значениях. Для каждого нового значения X возьмите выборку размера B из распределения коэффициентов модели. Простой способ сделать это в R - это предположить, что это Normal со средним значением coef(model)
и ковариационной матрицей vcov(model)
. Вычислите новый ожидаемый Y для каждого набора коэффициентов и суммируйте лот с интервалом. Затем перейдите к следующему значению X.
Мне кажется, что на этот метод не должны влиять какие-либо необычные преобразования, применяемые к любой из переменных, при условии, что вы также применяете их (или их инверсии) на каждом этапе выборки. Таким образом, если у подобранной модели есть log (X) в качестве предиктора, запишите новый X, прежде чем умножить его на выбранный коэффициент. Если подогнанная модель имеет sqrt (Y) в качестве зависимой переменной, возведите в квадрат каждое предсказанное среднее в выборке, прежде чем суммировать их как интервал.
Короче говоря, больше программирования, но меньше вычислений вероятности и, как следствие, клинически приемлемых предельных эффектов. Этот «метод» иногда упоминается как CLARIFY в литературе по политологии, но он довольно общий.