Я хотел бы сравнить две модели линейной регрессии, которые представляют скорости деградации мРНК во времени в двух разных условиях. Данные для каждой модели собираются независимо.
Вот набор данных.
Время (часы) log (обработка A) log (обработка B) 0 2.02 1.97 0 2.04 2.06 0 1,93 1,96 2 2.02 1.91 2 2,00 1,95 2 2,07 1,82 4 1,96 1,97 4 2.02 1.99 4 2.02 1.99 6 1,94 1,90 6 1,94 1,97 6 1,86 1,88 8 1,93 1,97 8 2.12 1,99 8 2.06 1.93 12 1,71 1,70 12 1,96 1,73 12 1,71 1,76 24 1,70 1,46 24 1,83 1,41 24 1,62 1,42
Это мои модели:
Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Вызов: лм (формула = Exp1 $ Время ~ Exp1 $ (Обработка A)) Остаточные: Мин 1Q Медиана 3Q Макс -6,8950 -1,2322 0,2862 1,2494 5,2494 Коэффициенты: Оценка Станд. Значение ошибки t Pr (> | t |) (Перехват) 74,68 6,27 11,91 2,94e-10 *** Exp1 $ (Обработка A) -36,14 3,38 -10,69 1,77e-09 *** --- Signif. коды: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 '' 1 Остаточная стандартная ошибка: 2,97 на 19 степеней свободы R-квадрат: 0,8575, R-квадрат: 0,85 F-статистика: 114,3 на 1 и 19 DF, значение p: 1,777e-09 Вызов: лм (формула = Exp1 $ Время ~ Exp1 $ (Обработка B)) Остаточные: Мин 1Q Медиана 3Q Макс -7,861 -3,278 -1,444 3,222 11,972 Коэффициенты: Оценка Станд. Значение ошибки t Pr (> | t |) (Перехват) 88.281 16.114 5.478 2.76e-05 *** Exp1 $ (Обработка B) -41,668 8,343 -4,994 8,05e-05 *** --- Signif. коды: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 '' 1 Остаточная стандартная ошибка: 5,173 на 19 степенях свободы R-квадрат: 0.5676, R-квадрат: 0.5449 F-статистика: 24,94 на 1 и 19 DF, значение p: 8,052e-05
Чтобы сравнить эти две модели, я использовал следующий код.
anova(Exp1.A.lm,Exp1.B.lm)
Анализ таблицы отклонений Модель 1: Exp1 $ Время ~ Exp1 $ Exp1 $ (Обработка A) Модель 2: Exp1 $ Время ~ Exp1 $ Exp1 $ (Обработка B) Res.Df RSS Df Сумма Sq F Pr (> F) 1 19 167.60 2 19 508,48 0 -340,88
Мой вопрос заключается в том, почему анализ ANOVA не показывает F-статистику и p.val. Мои извинения, если это наивный вопрос.
Исходя из разных уклонов, скорость деградации в этих двух моделях различна, но я хотел бы знать, насколько статистически значима эта разница. Я надеюсь, что это имеет смысл.
Ответы:
Если вы установите данные в одном длинном столбце с A и B в качестве нового столбца, вы сможете запустить свою регрессионную модель как GLM с непрерывной переменной времени и номинальной переменной «эксперимента» (A, B). Вывод ANOVA даст вам значимость разницы между параметрами. «Перехват» - это общий перехват, а фактор «эксперимента» будет отражать различия между перехватами (фактически, средними значениями) между экспериментами. «Время» будет общим уклоном, а взаимодействие - разницей между экспериментами в отношении к склону.
Я должен признать, что я обманываю (?) И сначала запускаю модели по отдельности, чтобы получить два набора параметров и их ошибки, а затем запускаю комбинированную модель, чтобы получить различия между обработками (в вашем случае A и B) ...
источник
Анализ ANOVA не показывает статистику F и значение p., поскольку обе модели имеют одинаковые остаточные степени свободы (т.е. 19), и если вы берете разницу, то она будет равна нулю! Должна быть как минимум одна степень свободы после того, как вы берете разницу, чтобы выполнить F-тест.
источник