Я не эксперт по случайным лесам, но я четко понимаю, что ключевая проблема со случайным лесом - это (случайное) генерирование деревьев. Можете ли вы объяснить мне, как создаются деревья? (т.е. что такое используемый дистрибутив для генерации дерева?)
Заранее спасибо !
machine-learning
r
algorithms
cart
random-forest
Робин Жирар
источник
источник
Основная идея заключается в процедуре упаковки, а не в том, чтобы деревья были случайными. Подробно каждое дерево построено на выборке объектов, нарисованных с заменой из исходного набора; таким образом, у каждого дерева есть некоторые объекты, которые он не видел, что делает весь ансамбль более разнородным и, следовательно, лучше обобщающим.
Кроме того, деревья ослабляются таким образом, что на каждом разбиении
mtry
учитываются только M (или ) случайно выбранных атрибутов; M обычно является квадратным корнем числа атрибутов в наборе. Это гарантирует, что деревья меньше перегружены, так как они не обрезаны. Вы можете найти более подробную информацию здесь .С другой стороны, существует вариант RF под названием Extreme Random Forest, в котором деревья создаются случайным образом (оптимизация разбиений отсутствует) - обратитесь, я думаю, к этой ссылке .
источник