Почему обрезка не нужна для случайных лесных деревьев?

20

Брейман говорит, что деревья выращены без обрезки. Почему? Я хочу сказать, что должна быть веская причина, по которой деревья в случайном лесу не обрезаются. С другой стороны, считается очень важным обрезать единственное дерево решений, чтобы избежать перебора. Есть ли литература для чтения по этой причине? Конечно, деревья могут быть не коррелированными, но все равно будет возможность их подгонки.

З Хан
источник
Вы действительно должны сказать больше о контексте здесь. @ChrisA. Я предпринял заметную попытку, но трудно понять, действительно ли на ваш вопрос дан ответ, потому что трудно узнать много о вашем затруднительном положении.
gung - Восстановить Монику
2
Что еще нужно сказать? Вопрос очень понятный.
Seanosapien

Ответы:

20

Грубо говоря, некоторая потенциальная перенастройка, которая может произойти в одном дереве (что является причиной, по которой вы вообще обрезаете ветку), смягчается двумя вещами в случайном лесу:

  1. Дело в том, что образцы, используемые для обучения отдельных деревьев, «загружаются».
  2. Тот факт, что у вас есть множество случайных деревьев, использующих случайные объекты и, следовательно, отдельные деревья, являются сильными, но не настолько коррелированными друг с другом.

Изменить: на основе комментария ОП ниже:

Там определенно все еще есть потенциал для переоснащения. Что касается статей, вы можете прочитать о мотивации «упаковки в мешки» Бреймана и «начальной загрузки» в целом Эфрона и Тибширани. Что касается 2., Бриман вывел свободную границу ошибки обобщения, которая связана с прочностью дерева и антикорреляцией отдельных классификаторов. Никто не использует границу (скорее всего), но она призвана дать интуитивное представление о том, что помогает уменьшить ошибку обобщения в методах ансамбля. Это в самой газете «Случайные леса». Мой пост должен был подтолкнуть вас в правильном направлении на основе этих чтений и моего опыта / выводов.

  • Брейман Л. Предсказатели мешков, машинное обучение, 24 (2), с. 123-140, 1996.
  • Эфрон, Б .; Тибширани Р. (1993). Введение в Bootstrap. Бока-Ратон, Флорида
  • Брейман, Лев (2001). «Случайные леса». Машинное обучение 45 (1): 5–32.
Крис А.
источник
Но все еще может быть возможность переоснащения. Можете ли вы привести статью для этого?
Z Хан
@ Z Khan Вы, возможно, также этот Z Хан ? Если это так, пожалуйста, дайте нам знать, чтобы мы могли объединить ваши учетные записи.
whuber
3
@ZKhan Проблема переоснащения в РФ рассматривается в Hastie et al. (2009) Элементы статистического обучения, 2-е издание. . На сайте доступен бесплатный PDF для книги. Проверьте главу о случайных лесах.
Восстановить Монику - Г. Симпсон