У меня был вопрос о параметре глубины взаимодействия в gbm в R. Это может быть вопрос noob, за который я прошу прощения, но как параметр, который, я считаю, обозначает количество терминальных узлов в дереве, в основном указывает X-way взаимодействие между предикторами? Просто пытаюсь понять, как это работает. Кроме того, я получаю довольно разные модели, если у меня есть набор данных, скажем, с двумя разными факторными переменными по сравнению с одним и тем же набором данных, за исключением того, что эти две факторные переменные объединены в один фактор (например, уровни X в факторе 1, уровни Y в факторе 2, объединенная переменная имеет X * Y факторы). Последнее значительно более предсказуемо, чем первое. Я думал, что увеличение глубины взаимодействия поднимет эти отношения.
источник
Связь между взаимодействие.депт и числом терминальных узлов
interaction.depth
interaction.depth
Связь между взаимодействие.depth и порядок взаимодействия
Связь между
interaction.depth
и порядок взаимодействия является более утомительным.Вместо того , чтобы рассуждать с interaction.depth, давайте порассуждаем с числом терминальных узлов, которые мы будем называемые J .
Пример: допустим, у вас есть J = 4 терминальных узла (взаимодействия.depth = 3), которые вы можете:
источник
Предыдущий ответ не верен.
У пней будет взаимодействие. Глубина 1 (и два листа). Но Interaction.depth = 2 дает три листа.
Итак: NumberOfLeaves = взаимодействия.depth + 1
источник
На самом деле предыдущие ответы неверны.
что эквивалентно:
источник
Можешь попробовать
таблица (прогноз (gbm (y ~., данные = TrainingData, распределение = "гауссовский", подробный = FALSE, n.trees = 1, усадка = 0,01, bag.fraction = 1, Interaction.depth = 1), n.trees = 1))
и увидите, что есть только 2 уникальных прогнозируемых значения. Interaction.depth = 2 даст вам 3 различных предсказанных значений. И убедить себя.
источник