Ситуация
У меня есть набор данных с одной зависимой и одной независимой переменной . Я хочу согласовать непрерывную кусочно-линейную регрессию с известными / фиксированными точками останова, возникающими в . Точки останова известны без неопределенности, поэтому я не хочу их оценивать. Затем я подгоняю регрессию (OLS) в форме Вот примерx k ( a 1 , a 2 , … , a k ) y i = β 0 + β 1 x i + β 2 max ( x i - a 1 , 0 ) + β 3 max ( x i - a 2 , 0 ) + … + Β k + 1 max ( x
R
set.seed(123)
x <- c(1:10, 13:22)
y <- numeric(20)
y[1:10] <- 20:11 + rnorm(10, 0, 1.5)
y[11:20] <- seq(11, 15, len=10) + rnorm(10, 0, 2)
Давайте предположим, что точка останова происходит в :
mod <- lm(y~x+I(pmax(x-9.6, 0)))
summary(mod)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.7057 1.1726 18.511 1.06e-12 ***
x -1.1003 0.1788 -6.155 1.06e-05 ***
I(pmax(x - 9.6, 0)) 1.3760 0.2688 5.120 8.54e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Перехват и наклон двух сегментов: и для первого и и для второго соответственно.
Вопросов
- Как легко рассчитать точку пересечения и уклон каждого отрезка? Можно ли переоценить модель, чтобы сделать это в одном расчете?
- Как рассчитать стандартную ошибку каждого наклона каждого сегмента?
- Как проверить, имеют ли два соседних уклона одинаковые уклоны (т. Е. Можно ли пропустить точку останова)?
источник
x
иI(pmax(x-9.6,0))
, верно ли это?Мой наивный подход, который отвечает на вопрос 1:
Но я не уверен, что статистика (в частности, степени свободы) сделаны правильно, если вы делаете это таким образом.
источник