Основанные на деревьях методы ансамбля, такие как Случайный лес и последующие производные (например, условный лес), предназначены для использования в так называемых задачах «маленький n , большой p » для определения относительной важности переменной. Действительно, похоже, что это так, но мой вопрос в том, как далеко может быть взята эта способность? Можно ли, скажем, 30 наблюдений и 100 переменных? Что является переломным моментом для такого подхода, и существуют ли какие-либо приличные практические правила, которые существуют? Я предпочел бы и приму ответы, подкрепленные ссылками на фактические доказательства (не предположения), используя либо смоделированные, либо реальные наборы данных. Я не нашел много на последнем ( здесь и здесь), так что ваши мысли / советы / (по теме) рекомендательные предложения приветствуются!
источник