Сравнение логистических коэффициентов на моделях с различными зависимыми переменными?

14

Это дополнительный вопрос из того, который я задал пару дней назад . Я чувствую, что это ставит другой взгляд на проблему, поэтому перечислил новый вопрос.

Вопрос в том, могу ли я сравнить величину коэффициентов по моделям с различными зависимыми переменными? Например, на одном примере скажем, что я хочу знать, является ли экономика более сильным предиктором голосов в палате представителей или за президента. В этом случае моими двумя зависимыми переменными будут голосование в палате (код 1 для демократа и 0 для республиканца) и голос за президента (1 для демократа и 0 для республиканца), а моей независимой переменной является экономика. Я ожидал бы статистически значимого результата в обоих офисах, но как мне оценить, имеет ли он «больший» эффект в одном больше, чем в другом? Это может быть не особенно интересный пример, но мне любопытно, есть ли способ сравнить. Я знаю, что нельзя просто посмотреть на «размер» коэффициента. Так, Возможно ли сравнение коэффициентов на моделях с различными зависимыми переменными? И, если это так, как это можно сделать?

Если что-то из этого не имеет смысла, дайте мне знать. Все советы и комментарии приветствуются.

Эйс
источник
2
Откуда вы знаете, что нельзя просто посмотреть на «размер» коэффициента?
OneStop
Я объединил твои два аккаунта. Вам все равно нужно зарегистрироваться, как указано в FAQ . (@onestop Thx за указание на дубликат.)
chl
Я предположил, что не смогу сравнить «эффект» предикторов по моделям, взглянув на коэффициенты из ответов на мой предыдущий вопрос. В моем примере все по-другому?
Ejs
2
Начало награды - кажется важным вопросом с тремя совершенно разными ответами, ни один из которых не имеет единого голоса . Мы можем сделать лучше. Ссылка Энди У на этот вопрос кажется уместной.
Мэтт Паркер

Ответы:

4

Краткий ответ «да, вы можете», но вы должны сравнить оценки максимального правдоподобия (MLE) «большой модели» со всеми коэффициентами в любой модели, подходящей для обеих.

Это «квазиформальный» способ получить теорию вероятностей, чтобы ответить на ваш вопрос

В этом примере и Y 2 являются переменными одного типа (доли / проценты), поэтому они сравнимы. Я предполагаю, что вы подходите одной модели к обоим. Итак, у нас есть две модели:Y1Y2

l o g ( p 1 i

M1:Y1iBin(n1i,p1i)
M2:Y2iBin(n2i,p2i)log(p 2 i
log(p1i1p1i)=α1+β1Xi
M2:Y2iBin(n2i,p2i)
log(p2i1p2i)=α2+β2Xя

Итак, у вас есть гипотеза, которую вы хотите оценить:

H0:β1>β2

И у вас есть некоторые данные и некоторая предварительная информация (например, использование логистической модели). Итак, вы рассчитываете вероятность:{Y1i,Y2i,Xi}i=1n

P=Pr(H0|{Y1i,Y2i,Xi}i=1n,I)

H0

P=Pr(H0,α1,α2,β1,β2|{Y1i,Y2i,Xi}i=1n,I)dα1dα2dβ1dβ2

Гипотеза просто ограничивает диапазон интеграции, поэтому мы имеем:

P=β2Pr(α1,α2,β1,β2|{Y1i,Y2i,Xi}i=1n,I)dα1dα2dβ1dβ2

Поскольку вероятность зависит от данных, она будет учитываться в двух отдельных постерах для каждой модели.

Pr(α1,β1|{Y1i,Xi,Y2i}i=1n,I)Pr(α2,β2|{Y2i,Xi,Y1i}i=1n,I)

Y1iα2,β2XiY2i

V1V2αj

P=Φ(β^2,MLEβ^1,MLEV1:β,β+V2:β,β)

Φ()

probabilityislogic
источник
3

Почему нет? Модели оценивают, насколько 1 единица изменения в любом предикторе модели повлияет на вероятность «1» для выходной переменной. Я предполагаю, что модели одинаковы - в них одинаковые предикторы. Наиболее информативным способом сравнения относительных величин любого данного предиктора в 2 моделях является использование моделей для расчета (детерминистически или лучше с помощью моделирования), насколько значительный прирост изменений (например, +/- 1 SD) в Предиктор влияет на вероятности соответствующих исходных переменных - и сравни их! Вам нужно будет определить доверительные интервалы для двух оценок, а также убедиться, что разница «значительна» практически и статистически.

dmk38
источник
Спасибо dmk8, очень полезно. Некоторые последующие вопросы / вопросы: часто ли это имеет в виду, когда речь идет об изменении переменной интереса (например, экономики от плохой к хорошей), когда все управляющие переменные находятся на своих средствах? Что вы подразумеваете под детерминистически? Как определить доверительные интервалы вокруг вероятностей?
Ejs
2
Посоветуйтесь с королем. Он не разочарует. King, G., Tomz, M. & Wittenberg., J. (2000). Максимальное использование статистического анализа: улучшение интерпретации и представления. Am. J. Pol. Sci, 44 (2), 347-361.
dmk38
2

Я предполагаю, что «моей независимой переменной является экономика», вы используете сокращение для какого-то конкретного предиктора.

На одном уровне я не вижу ничего плохого в том, чтобы делать такие заявления, как

X предсказывает Y1 с коэффициентом шансов _ и 95% доверительным интервалом [_, _], а X прогнозирует Y2 с коэффициентом шансов _ и 95% доверительным интервалом [_, _].

Недавние предложения @ dmk38 выглядят очень полезными в этом отношении.

Вы также можете стандартизировать коэффициенты для облегчения сравнения.

На другом уровне остерегайтесь брать косвенные статистические данные (стандартные ошибки, p-значения , CI) буквально, когда ваша выборка представляет собой неслучайную выборку из совокупности лет, которые вы, возможно, захотите обобщить.

rolando2
источник
Да, «экономика» - это сокращение для восприятия национальных экономических условий. Применяется ли тот же совет, когда другие предикторы (контроли) включены в модель?
Ejs
@Ejs - боюсь, нет короткого ответа на ваш последний вопрос. Вы понимаете, что значит оценивать отношения при использовании статистического контроля - сказочно запутанная тема, заслуживающая тщательного изучения. Вы также, вероятно, попадаете в тему выбора переменных, которая также является большой. Имхо лучший источник для совершенного студента этих тем Pedhazur в amazon.com/Multiple-regression-behavioral-research-Pedhazur/...
rolando2
1

X1=1X1=0

β1X1=1X1=0

β1

ocram
источник
Имеет ли это какое-либо значение для предложения Roland2?
Ejs
@Ejs. Вы ссылаетесь на этап стандартизации? Кстати, мой ответ помогает? Я неправильно понял вопрос?
ocram