Случайные леса имеют репутацию среди самых эффективных методов классификации. Тем не менее, мы не сталкиваемся с ними в учебно-теоретической литературе, из которой я предполагаю отсутствие глубоких теоретических результатов. Если бы кто-то хотел вникнуть в эту теорию, с чего бы начать?
9
Ответы:
После ответа Симоны у Джерарда Бяу есть несколько очень хороших работ, в которых рассматривается сходимость и согласованность случайных лесов. Анализ проводится для слегка упрощенных версий алгоритма по сравнению с Breiman 2001, но менее упрощен, чем предыдущие результаты.
Все документы Бяу (вместе с его сотрудниками) доступны на его веб-сайте:
http://www.lsta.upmc.fr/BIAU/publications.html
Особенно актуальна работа по согласованию в прессе: http://www.lsta.upmc.fr/BIAU/sbv.pdf
Есть еще 2-3 статьи со случайным содержанием леса. Я только что присоединился к cstheory, поэтому я не могу опубликовать более двух ссылок, но на вышеуказанном сайте публикаций есть все.
Я надеюсь, что это поможет. Похоже, что с 2008 года наблюдается всплеск активности после периода в значительной степени эмпирического использования метода. И хорошая новость заключается в том, что теоретические исследования, похоже, показывают, что метод является надежным и имеет хорошие свойства.
источник
Полагаю, вы уже посмотрели статью Бреймана за 2001 год о ВЧ. Я могу просто указать на несколько других ссылок:
Эмпирические сравнения различных упрощений RF, которые позволяют доказывать теоремы: сужение разрыва: случайные леса в теории и на практике
Это новейшая ссылка, которую я могу предоставить. В этой статье вы также можете найти некоторые цитаты из статей Бяу о начальных работах по теоретическим результатам для РФ.
Если вас интересуют теоретические результаты о важности переменных в РФ: понимание значения переменных в лесах случайных деревьев
На самом деле я только что узнал, что автор последней статьи (Жиль Луппе) только что опубликовал на arxiv свою диссертацию (v2): Понимание случайных лесов: от теории к практике
источник