Определение естественных кубических сплайнов для регрессии

16

Я изучаю сплайны из книги Hastie et al. "Элементы статистического изучения данных: добыча, вывод и прогнозирование". На странице 145 я обнаружил, что естественные кубические сплайны линейны за граничными узлами. В есть узлов, и о таком сплайне в книге дается следующее.Kξ1,ξ2,...ξKвведите описание изображения здесь

Вопрос 1: Как освобождаются 4 степени свободы? Я не понимаю эту часть.

Вопрос 2 : В определении когда тогда . Что автор пытается сделать в этой формуле? Как это помогает убедиться, что сплайны линейны за граничными узлами?dk(X)k=KdK(X)=00

Durin
источник

Ответы:

17
  1. Начнем с рассмотрения простых кубических сплайнов. Они кубичны между каждой парой узлов и кубичны за пределами граничных узлов. Мы начинаем с 4df для первой кубики (слева от первого граничного узла), и каждый узел добавляет один новый параметр (потому что непрерывность кубических сплайнов и производных и вторых производных добавляет три ограничения, оставляя один свободный параметр), в результате чего получается параметра для K узлов.K+4K

    Естественный кубический сплайн является линейным с обоих концов. Это ограничивает кубические и квадратные части там до 0, каждый уменьшая ФР на 1. Именно 2 ДФ на каждом из двух концов кривой, уменьшая к K .K+4K

    Представьте, что вы решили, что можете потратить некоторое общее количество степеней свободы ( скажем, ) на непараметрическую оценку кривой. Поскольку для наложения естественного сплайна используется на 4 степени свободы меньше, чем для обычного кубического сплайна (для того же числа узлов), с этими параметрами p можно иметь еще 4 узла (и, следовательно, еще 4 параметра) для моделирования кривой между граничными узлами. ,pp

  2. Следует отметить , что определение для к = 1 , 2 , . , , , K - 2 (поскольку всего K базисных функций). Таким образом, последняя базисная функция в этом списке, N K = d K - 2 - d K - 1 . Таким образом, наибольшее k, необходимое для определения d k, относится к k = K - 1Nk+2k=1,2,...,K2KNK=dK2dK1kdkk=K1, (То есть, нам не нужно , чтобы попытаться выяснить , что некоторые могли бы сделать, так как мы не используем его.)dK

Glen_b - Восстановить Монику
источник
4

Я детализирую утверждение: «Это освобождает четыре степени свободы (два ограничения каждое в обеих граничных областях)» в примере с узлами ξ 1 , ξ 2 . Связанными интервалами являются : - , ξ 1 [ , ] ξ 1 , ξ 2 [ и ] ξ 2 , + [ (поэтому существуют | I | = 3 интервала и | I | - 1 = 22ξ1,ξ2],ξ1[]ξ1,ξ2[]ξ2,+[|I|=3|I|1=2 узлы).

Для (общих) кубических сплайнов

Без ограничений регулярности имеем уравнений:4|I|=12

1(X<ξ1)  ;  1(X<ξ1)X  ;  1(X<ξ1)X2  ;  1(X<ξ1)X3  ;
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X  ;  1(ξ2X)X2  ;  1(ξ2X)X3.

Crr=2(r+1)×(|I|1)=3×(|I|1)=6

126=6

Для естественных кубических сплайнов

« Естественные кубические сплайны добавляют дополнительные ограничения, а именно, эта функция является линейной за граничными узлами».

4|I|4=12442

1(X<ξ1)  ;  1(X<ξ1)X  ;  
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X.

3×(|I|1)=6

86=2

ahstat
источник