Поскольку регрессионное моделирование часто является больше «искусством», чем наукой, я часто проверяю множество итераций регрессионной структуры. Каковы некоторые эффективные способы суммирования информации из этих множественных прогонов модели в попытке найти «лучшую» модель? Один из подходов, который я использовал, - это поместить все модели в список и просмотреть summary()
этот список, но я думаю, что есть более эффективные способы сравнения?
Пример кода и модели:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm1 <- lm(weight ~ group)
lm2 <- lm(weight ~ group - 1)
lm3 <- lm(log(weight) ~ group - 1)
#Draw comparisions between models 1 - 3?
models <- list(lm1, lm2, lm3)
lapply(models, summary)
r
regression
гнаться
источник
источник
Ответы:
Сюжет их!
http://svn.cluelessresearch.com/tables2graphs/longley.png
Или, если необходимо, используйте таблицы: пакет apsrtable или
mtable
функцию в пакете memisc .С помощью
mtable
источник
grid
неlattice
:)memisc
раньше не знал , похоже, что это очень удобный пакет в колчане!Следующее не дает точного ответа на вопрос. Это может дать вам некоторые идеи, хотя. Это то, что я недавно сделал, чтобы оценить соответствие нескольких моделей регрессии, используя от одной до четырех независимых переменных (зависимая переменная была в первом столбце кадра данных df1).
Содержимое as.character (formlist) было
Затем я собрал несколько полезных показателей
Окончательный кадр данных был
Наконец, Cp-график (с использованием библиотеки wle)
источник