В этой статье утверждается, что в CART, поскольку двоичное разбиение выполняется в одной ковариате на каждом шаге, все разбиения являются ортогональными и, следовательно, взаимодействия между ковариатами не рассматриваются.
Тем не менее, многие очень серьезные ссылки утверждают, напротив, что иерархическая структура дерева гарантирует, что взаимодействия между предикторами будут автоматически смоделированы (например, эта статья и, конечно, Hastie).
Кто прав? Собирают ли CART-деревья взаимодействия между входными переменными?
Ответы:
источник
Короткий ответ
CARTs нужна помощь в захвате взаимодействий.
Длинный ответ
Возьмите точный жадный алгоритм (Chen and Guestrin, 2016):
Среднее значение на листе будет условным ожиданием, но каждое разбиение на пути к листу не зависит от другого. Если функция A не имеет значения сама по себе, но имеет значение при взаимодействии с функцией B, алгоритм не будет разделен на функцию A. Без этого разделения алгоритм не может предвидеть разделение для функции B, необходимое для генерации взаимодействия.
Благодаря множеству функций, регуляризации и жесткому ограничению количества разбиений один и тот же алгоритм может пропускать взаимодействия.
обходные
Явные взаимодействия как новые функции
Пример из Чжана («Победа в соревнованиях по науке о данных», 2015):
Не жадные алгоритмы дерева
В другом вопросе Симона предлагает алгоритмы, основанные на прогнозировании и косые деревья решений .
Другой подход к обучению
Некоторые методы обучения лучше обрабатывают взаимодействия.
Вот таблица из «Элемента статистического обучения» (строка «Способность извлекать линейные комбинации признаков»):
источник