Вот краткий вывод использованной мною модели Кокша (я использовал R, и вывод основан на наилучшей конечной модели, т.е. включены все значимые объясняющие переменные и их взаимодействия):
coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 +
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)
n = 555
coef exp(coef) se(coef) z Pr(>|z|)
LT 9.302e+02 Inf 2.822e+02 3.297 0.000979 ***
Food 3.397e+03 Inf 1.023e+03 3.321 0.000896 ***
Temp2 5.016e+03 Inf 1.522e+03 3.296 0.000979 ***
LT:Food -2.250e+02 1.950e-98 6.807e+01 -3.305 0.000949 ***
LT:Temp2 -3.327e+02 3.352e-145 1.013e+02 -3.284 0.001022 **
Food:Temp2 -1.212e+03 0.000e+00 3.666e+02 -3.307 0.000942 ***
LT:Food:Temp2 8.046e+01 8.815e+34 2.442e+01 3.295 0.000986 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Rsquare= 0.123 (max possible= 0.858 )
Likelihood ratio test= 72.91 on 7 df, p=3.811e-13
Wald test = 55.79 on 7 df, p=1.042e-09
Score (logrank) test = 78.57 on 7 df, p=2.687e-14
Вопрос:
Как интерпретировать значения коэффициентов и exp (coef) в этом случае, поскольку они являются очень большими значениями? Также задействовано 3 случая взаимодействия, что еще больше запутывает интерпретацию.
Все примеры, относящиеся к модели Кокша, которые я нашел до сих пор в Интернете, были действительно простыми в отношении терминов взаимодействия (которые всегда оказывались незначительными), а также значений коэффициентов (= коэффициенты опасности) и их экспоненты (= коэффициенты риска) были довольно маленькими и «простыми в обращении» числами, например, коэффициент = 1,73 -> exp (coef) = 5,64. НО мои цифры намного больше, как вы можете видеть из итоговых результатов (выше). И поскольку они такие большие, они, кажется, не имеют никакого смысла.
Кажется немного смешным думать, что выживаемость, например, в 8,815e + 34 (отношение рисков, взятых из взаимодействия LT: Еда: Temp2) в разы ниже, когда взаимодействие увеличивается на одну единицу (?).
На самом деле я тоже не знаю, как интерпретировать это трехчастное взаимодействие. Означает ли это, что когда все переменные во взаимодействии увеличиваются на одну единицу, выживаемость уменьшается на определенную величину (определяется значением exp (coef))?
Было бы здорово, если бы кто-нибудь мог помочь мне здесь. :)
Ниже приведена часть моей таблицы данных, которую я использовал для анализа Кокса. Здесь вы можете видеть, что я много раз использовал одно и то же объяснительное значение переменной (т. Е. LT, Food и Temp2) для нескольких «Time, Status response variable». Эти значения пояснительной переменной уже являются средними значениями этих переменных (из-за того, что в природе были установлены полевые работы, было невозможно получить индивидуальное значение пояснительной переменной для каждого наблюдаемого индивидуального ответа, следовательно, средние значения использовались уже на этом этапе ), и это ответило бы на предложение 1 (?) (см. первый ответ).
Предложение 2 (см. 1-й ответ): я использую R, и я еще не супер бог в этом. :) Таким образом, если я использую функцию предиката (cox.model, type = "Ожидаемый"), я получаю огромное количество различных значений и не имею понятия, к какой объясняющей переменной они относятся и в каком порядке. Или можно выделить определенный член взаимодействия в функции предикторов? Я не уверен, что я проясняю себя здесь.
Предложение 3 (см. 1-й ответ): в части таблицы данных ниже можно увидеть единицы различных объясняющих переменных. Все они разные и включают десятичные дроби. Может ли это быть как-то связано с исходом Кокса?
Часть таблицы данных:
Time (days) Status LT(h) Food (portions per day) Temp2 (ºC)
28 0 14.42 4.46 3.049
22 0 14.42 4.46 3.049
9 1 14.42 4.46 3.049
24 0 15.33 4.45 2.595
24 0 15.33 4.45 2.595
19 1 15.33 4.45 2.595
Ура, унна
Ответы:
Пара предложений, не связанных напрямую с CoxPH, а с взаимодействиями и коллинеарностью
1) Когда вы получаете «сумасшедшие» значения, подобные этим, одна из возможностей - это коллинеарность. Это часто проблема, когда у вас есть взаимодействие. Вы центрировали все свои переменные (вычитая среднее из каждой)?
2) Вы не можете так легко интерпретировать одно взаимодействие между многими. LT, food и temp2 участвуют во многих взаимодействиях. Итак, посмотрите на прогнозируемые значения из разных комбинаций.
3) Проверьте единицы измерения различных переменных. Когда вы получаете сумасшедшие параметры, иногда это проблема единиц измерения (например, измерение роста человека в миллиметрах или километрах)
4) После того, как вы разобрались в этом, я считаю, что самый простой способ подумать о влиянии различных взаимодействий (особенно высокоуровневых) - это построить график прогнозируемых значений с различными комбинациями независимых значений.
источник