Зачем использовать возраст в квадрате в качестве ковариации в исследовании генетической ассоциации?

11

Зачем использовать возраст и квадрат в качестве ковариат в исследовании генетической ассоциации? Я могу понять использование возраста, если он был определен как значимый ковариат, но я не знаю, как использовать возраст в квадрате.

Kevin
источник
1
Не могли бы вы привести пример?
Андрей
5
Вы ищете ответ для конкретной области или общий ответ, почему подобные вещи выполняются в линейной модели? Я полагаю, что не в предметной области в исследованиях по типу выживаемости принято указывать возраст и квадрат в квадрате для моделирования относительно линейной частоты неудач в первые годы жизни субъекта, за которым следует стремительный рост частоты неудач по мере достижения субъектом «старости». , Будет ли это применяться в исследовании генетической ассоциации, если какая-то характеристика была связана со старостью?
Уэйн
Спасибо за ответы! В качестве примера можно привести исследования ассоциаций потенциальных популяционных генов с минеральной плотностью кости, количественным признаком, который является фактором риска остеопороза, и да, это характеристика, связанная со старением.
Кевин
В модели также есть возрастной термин?
Fomite

Ответы:

9

Аппроксимации ряда Тейлора говорят нам, что почти любая гладкая функция может быть аппроксимирована полиномом, поэтому, включая такие термины, как или (где x - это возраст для вашего примера), давайте оценим коэффициенты для аппроксимации для известного или неизвестная нелинейная функция или возраста в вашем случае. Тестирование этих коэффициентов также является простым способом проверить, является ли взаимосвязь достаточно линейной или нелинейные условия дадут лучшее соответствие.х 3 хx2x3x

В зависимости от конечной цели анализа, нелинейные термины могут быть сохранены для прогнозирования, или графики прогноза могут использоваться, чтобы предложить фактические функциональные отношения. Существуют и другие инструменты, такие как кубические сплайны, которые можно использовать вместо полиномиальных терминов для достижения аналогичных целей, но добавление квадрата является быстрым и простым способом сделать это.

Грег Сноу
источник
2

Проще говоря: добавление квадрата переменной позволяет более точно смоделировать влияние возраста, которое может иметь нелинейные отношения с независимой переменной. Например, влияние возраста может быть положительным вплоть до, скажем, возраста 50 лет, а затем отрицательным.

Добавление квадрата возраста к возрасту позволяет моделировать эффект для разных возрастов, а не предполагать, что эффект является линейным для всех возрастов.

См. Мой пост в блоге для простого пошагового руководства и того, как интерпретировать переменную возраста и возраста в квадрате.

http://www.excel-with-data.co.uk/blog-1/how-to-regression-analysis-in-excel/

user34889
источник
1

Возможно, что преобразование было сделано для того, чтобы удовлетворить предположения модели. Возможно, это также было сделано из-за наличия каких-то квадратичных отношений.

StatsStudent
источник