Брейман говорит, что деревья выращены без обрезки. Почему? Я хочу сказать, что должна быть веская причина, по которой деревья в случайном лесу не обрезаются. С другой стороны, считается очень важным обрезать единственное дерево решений, чтобы избежать перебора. Есть ли литература для чтения по этой причине? Конечно, деревья могут быть не коррелированными, но все равно будет возможность их подгонки.
machine-learning
З Хан
источник
источник
Ответы:
Грубо говоря, некоторая потенциальная перенастройка, которая может произойти в одном дереве (что является причиной, по которой вы вообще обрезаете ветку), смягчается двумя вещами в случайном лесу:
Изменить: на основе комментария ОП ниже:
Там определенно все еще есть потенциал для переоснащения. Что касается статей, вы можете прочитать о мотивации «упаковки в мешки» Бреймана и «начальной загрузки» в целом Эфрона и Тибширани. Что касается 2., Бриман вывел свободную границу ошибки обобщения, которая связана с прочностью дерева и антикорреляцией отдельных классификаторов. Никто не использует границу (скорее всего), но она призвана дать интуитивное представление о том, что помогает уменьшить ошибку обобщения в методах ансамбля. Это в самой газете «Случайные леса». Мой пост должен был подтолкнуть вас в правильном направлении на основе этих чтений и моего опыта / выводов.
источник