Определение из min_child_weight параметра в xgboost задается как:
минимальная сумма веса экземпляра (гессиана), необходимая ребенку. Если в результате шага разбиения дерева получится листовой узел с суммой веса экземпляра меньше, чем min_child_weight, то процесс сборки прекратит дальнейшее разбиение. В режиме линейной регрессии это просто соответствует минимальному количеству экземпляров, которое должно быть в каждом узле. Чем больше, тем более консервативным будет алгоритм.
Я прочитал довольно много вещей о xgboost, включая оригинальную статью (см. Формулу 8 и ту, которая приведена сразу после уравнения 9), этот вопрос и большинство вопросов, связанных с xgboost, которые появляются на первых нескольких страницах поиска Google. ;)
По сути, я все еще не рад тому, почему мы накладываем ограничение на сумму гессиана? Моя единственная мысль в минуте из оригинальной статьи состоит в том, что она относится к разделу взвешенного квантильного эскиза (и переформулировке по уравнению 3 взвешенного квадрата потерь), в котором является «весом» каждого экземпляра.
Еще один вопрос связан с тем, почему это просто число экземпляров в режиме линейной регрессии? Я думаю, это связано со второй производной уравнения суммы квадратов?
источник