Как вы строите взаимодействие между фактором и непрерывным ковариатом?
9
Я хотел бы нарисовать на том же графике взаимодействие между моим постоянным предиктором и моим категорическим модератором. Я знаю, как это сделать, когда оба категориальны ( взаимодействие факторов ), но на самом деле не знаю, как это сделать, когда один непрерывен, а другой категоричен.
Если вы говорите о взаимодействии в общей линейной модели (например, ANCOVA), и если ваш категориальный модератор имеет достаточно небольшое количество уровней, вы можете построить отдельные линии регрессии для каждого уровня модератора. Если вы хотите, чтобы они были на одном графике, наложите их, кодируйте по цвету или типу линии и предоставьте легенду. Одна из осей вашего графика будет представлять непрерывный предиктор (предположительно, горизонтальную ось « »), а другая будет представлять зависимую переменную, которая, я предполагаю, является непрерывной. Если ваш категорический предиктор (модератор) имеет более четырех уровней, это может стать слишком занятым для одного графика, но я не знаю лучшего метода для таких обстоятельств, который не прибегает к отдельным графикам для каждого уровня.Икс
Спасибо за ответ! Я на самом деле имею в виду GLM (одномерный), который позволяет мне составлять только приблизительные предельные значения для факторных взаимодействий. Я не уверен, как наложить, как вы говорите ... Я работаю с SPSS. не могли бы вы подробнее рассказать об этом?
Андрея
1
Для SPSS просто сохраните прогнозные значения после оценки модели. Затем на графике отобразите прогнозируемые значения по оси Y и непрерывный предиктор по оси X, затем используйте категориальную переменную для группировки линий или точек.
Энди В.
Спасибо! просто чтобы уточнить, какой график мне нужен для этого? Это точечный график с линией регрессии? Если так, то мне нужно было бы создать 3 разных графика для 3 разных уровней моего модератора ... как мне поставить его на один и тот же график? Также просто уточнить, что прогнозируемые значения принимают во внимание скорректированную регрессию с ковариатами?
Андрея
1
@ Андреа, я добавил ответ на ваш комментарий.
Penguin_Knight
@ AndyW Вы сохраняете прогнозные значения из оценочной модели с или без термина взаимодействия (или это не имеет значения)?
Jeremyjaytaylor
4
Просто чтобы ответить на следующий комментарий:
Спасибо! просто чтобы уточнить, какой график мне нужен для этого? Это точечный график с линией регрессии? Если так, то мне нужно было бы создать 3 разных графика для 3 разных уровней моего модератора ... как мне поставить его на один и тот же график? Также просто уточнить, что прогнозируемые значения принимают во внимание скорректированную регрессию с ковариатами?
Вот как это сделать в SPSS. Я использую Employee.savданные в качестве примера. Предположим, мы хотели бы использовать зарплату в качестве результата, начальную зарплату в качестве непрерывного предиктора и категорию работы в качестве категориального предиктора:
Перейти к графику> Legacy> Scatter:
Выбирай просто разбросанный сюжет нормально. Затем заполните переменные:
Затем вы увидите график рассеяния. Дважды щелкните график рассеяния, чтобы открыть редактор диаграмм. Вверху щелкните значок, чтобы «подогнать линии к подгруппам». Смотрите картинку ниже:
Выполнено:
Теперь вопрос о том, используете ли вы исходную переменную зарплаты в качестве результата или прогнозируемую зарплату в качестве результата, скорректированного для других третьих или более предикторов, зависит от вашей цели. Исходная зарплата будет лучше подходить для исследования, в то время как прогнозируемая заработная плата будет более подходящей для представления результатов регрессии.
благодарю вас! Это подтверждает то, что я сделал хорошо, у меня есть другие ковариации, поэтому я должен использовать прогнозируемый результат (сохраненный как нестандартный в регрессионной модели). Это очень помогает!
Андрея
У меня есть еще один вопрос: я не уверен, что мне следует придерживаться непрерывных предикторов в моем регрессионном анализе, поскольку связи, хотя и существенные как до, так и после корректировки, по-видимому, обусловлены большими выбросами. Если я разделю свой предиктор на 3 категории (нулевые частоты, ниже и выше медианы), то у меня больше не будет никаких существенных связей с непрерывным исходом. Любые предложения о том, что лучший путь будет? спасибо
Андрея
О скольких "больших выбросах" мы говорим? Есть ли у вас какая-либо другая необычная информация о них, которая могла бы оправдать их исключение из вашего образца? Если это меньше зависит от выбросов, чем от ненормального распределения, вы можете рассмотреть вопрос о создании надежного / непараметрического GLM, чтобы уменьшить смещение в ваших результатах.
Ник Стаунер
спасибо за предложение. Мои непрерывные результаты не кажутся нормально распределенными, когда я делаю гистограмму, но когда я делаю график остатков (сохраняю стандартизированные остатки в GLM), и я ищу приблизительно прямоугольный разброс, они, кажется, вписываются в этот образец, который предлагает аналогичные уровни вариации в диапазоне прогнозируемого значения, так что я бы сказал, это нормально. С точки зрения выбросов, судя по точечной диаграмме, между 1-3 выбросами (кажется, я не могу скопировать и вставить графики здесь). Я никогда не работал с непараметрическим GLM, поэтому не уверен, где найти это в SPSS
Просто чтобы ответить на следующий комментарий:
Вот как это сделать в SPSS. Я использую
Employee.sav
данные в качестве примера. Предположим, мы хотели бы использовать зарплату в качестве результата, начальную зарплату в качестве непрерывного предиктора и категорию работы в качестве категориального предиктора:Перейти к графику> Legacy> Scatter:
Выбирай просто разбросанный сюжет нормально. Затем заполните переменные:
Затем вы увидите график рассеяния. Дважды щелкните график рассеяния, чтобы открыть редактор диаграмм. Вверху щелкните значок, чтобы «подогнать линии к подгруппам». Смотрите картинку ниже:
Выполнено:
Теперь вопрос о том, используете ли вы исходную переменную зарплаты в качестве результата или прогнозируемую зарплату в качестве результата, скорректированного для других третьих или более предикторов, зависит от вашей цели. Исходная зарплата будет лучше подходить для исследования, в то время как прогнозируемая заработная плата будет более подходящей для представления результатов регрессии.
источник