Насколько я понимаю, случайный лес выбирает случайным образом переменные mtry для построения каждого дерева решений. Таким образом, если mtry = ncol / 3, то каждая переменная будет использоваться в среднем на 1/3 деревьев. И 2/3 деревьев не будут их использовать.
Но что, если я знаю, что одна переменная, вероятно, очень важна, было бы хорошо, чтобы вручную увеличить вероятность выбора этой переменной в каждом дереве? Это возможно с пакетом randomForest в R?
источник
С июня 2015 года эта функция появилась в новом многообещающем радиочастотном алгоритме R-CRAN под названием «рейнджер». Он подправлен с помощью split.select.weights : «Числовой вектор с весами от 0 до 1, представляющий вероятность выбора переменных для разделения».
источник