Я пытаюсь решить проблему для наименьшего угла регрессии (LAR). Это проблема 3,23 на странице 97 из Гесте и др., Элементы статистического обучения, второй. редактор (5-я печать) .
Рассмотрим регрессионную проблему со всеми переменными и ответом, имеющими среднее значение ноль и стандартное отклонение единицу. Предположим также, что каждая переменная имеет одинаковую абсолютную корреляцию с ответом:
Пусть будет коэффициентом наименьших квадратов в \ mathbf {X} и пусть \ mathbf {u} (\ alpha) = \ alpha \ bf {X} \ hat {\ beta} для \ alpha \ in [0,1] .
Меня просят показать, что
и у меня проблемы с этим. Обратите внимание, что это в основном говорит о том, что корреляции каждого с остатками остаются равными по величине по мере продвижения к .
Я также не знаю, как показать, что корреляции равны:
Любые указатели будут с благодарностью!
Ответы:
Это проблема 3,23 на странице 97 из Гесте и др., Элементы статистического обучения , второй. редактор (5-я печать) .
Ключом к этой проблеме является хорошее понимание обычных наименьших квадратов (т. Е. Линейной регрессии), в частности, ортогональности подобранных значений и невязок.
Лемма об ортогональности : пусть будет матрицей проектирования , вектором отклика и (истинными) параметрами. Предполагая, что является полным рангом (что мы и будем везде), OLS-оценки : . Подходящие значения: . Тогда . То есть подобранные значения ортогональны остаткам. Это следует, поскольку ,п × р у & beta ; Х & beta ; & beta ; = ( Х Т Х ) - 1 х Т у у = Х ( Х Т Х ) - 1 х Т у ⟨ у , у - у ⟩ = у Т ( у - у ) = 0 Х Т ( у -Икс n×p y β X β β^= ( XTИкс)- 1ИксTY Y^= X( ХTИкс)- 1ИксTY ⟨ у^, у- у^⟩ = У^T( у- у^) = 0 ИксT( у- у^) = XTY- ХTИкс( ХTИкс)- 1ИксTY= XTY- ХTY= 0
Теперь быть вектор - столбец такой , что является - го столбца . Предполагаемые условия:x j j XИксJ ИксJ J Икс
Обратите внимание, что, в частности , последнее утверждение леммы об ортогональности идентично для всех .J⟨ хJ,у- у^⟩ = 0 J
Корреляции связаны
Теперь . Итак, а второе слагаемое в правой части равно нулю по лемме об ортогональности , поэтому по желанию. Абсолютное значение корреляций просто ⟨ х J , у - у ( ) ⟩ = ⟨ х J , ( 1 - α ) у + α у - α у ⟩ = ( 1 - α ) ⟨ х J , у ⟩ + & alpha ; ⟨ у -u ( α ) = α Xβ^= α y^
Примечание : правая часть выше не зависит от а числитель точно такой же, как ковариация, так как мы предположили, что все и центрированы (поэтому, в частности, вычитание среднего не требуется ).J ИксJ Y
В чем смысл? По мере увеличения вектор отклика изменяется так, что он постепенно приближается к ( ограниченному! ) Решению наименьших квадратов, полученному в результате включения в модель только первых параметров. Это одновременно изменяет оценочные параметры, поскольку они являются простыми внутренними произведениями предикторов с (измененным) вектором ответа. Модификация принимает особую форму, хотя. Он сохраняет (величину) корреляции между предикторами и измененным откликом одинаковыми на протяжении всего процесса (даже если значение корреляции изменяется). Подумайте о том, что это делает геометрически, и вы поймете название процедуры!α п
Явная форма (абсолютной) корреляции
Давайте сосредоточимся на термине в знаменателе, поскольку числитель уже находится в требуемой форме. У нас есть
Подставляя в и используя линейность внутреннего произведения, получимu ( α ) = α y^
Соблюдайте это
Собрав все это вместе, вы заметите, что мы получаем
Чтобы обернуть вещи, и поэтому ясно, что монотонно уменьшается в и как .1−RSSN=1N(⟨y,y,⟩−⟨y−y^,y−y^⟩)≥0 ρ^j(α) α ρ^j(α)↓0 α↑1
Эпилог : сконцентрируйтесь на идеях здесь. Там действительно только один. Ортогональность лемма делает почти всю работу за нас. Все остальное - это алгебра, нотация и умение использовать последние два.
источник