Эй, ребята, я нашел одну или две статьи, в которых используется регрессия гребня (для данных о баскетболе). Мне всегда говорили стандартизировать мои переменные, если я запускал регрессию гребня, но мне просто сказали сделать это, потому что гребень был масштабным вариантом (регрессия гребня не была действительно частью нашего курса, поэтому наш лектор просматривал его).
Эти документы, которые я читал, не стандартизировали их переменные, что показалось мне немного удивительным. Они также получили большие значения лямбда (около уровня 2000-4000) через перекрестную проверку, и мне сказали, что это связано с не стандартизацией переменных.
Как именно оставление переменной (ей) нестандартной приводит к высоким значениям лямбды, а также, каковы последствия не стандартизации переменных в целом? Это действительно такая большая сделка?
Любая помощь очень ценится.
источник
Хотя на четыре года позже, надеюсь, кто-то выиграет от этого ... Как я понял, коэффициент - это то, насколько целевая переменная изменяется для изменения единицы в независимой переменной (dy / dx). Предположим, мы изучаем связь между весом и ростом, а вес измеряется в кг. Когда мы используем Километры для высоты, вы можете представить, что большинство точек данных (для человеческого роста) упакованы близко. Таким образом, для небольшого дробного изменения роста будет происходить огромное изменение веса (при условии увеличения веса с ростом). Соотношение dy / dx будет огромным. С другой стороны, если высота измеряется в миллиметрах, данные будут распространяться повсюду по атрибутам высоты. На единицу изменения высоты не будет существенного изменения веса, dy / dx будет очень маленьким почти близко к 0.
источник