Почему в пакетах используются образцы начальной загрузки?

10

Пакетирование - это процесс создания N учащихся на N различных выборках начальной загрузки, а затем на основе их прогнозов.

Мой вопрос: почему бы не использовать любой другой тип отбора проб? Зачем использовать образцы начальной загрузки?


источник

Ответы:

9

Интересный вопрос. Бутстрап обладает хорошими пробоотборными свойствами по сравнению с некоторыми альтернативами, такими как складной нож. Основным недостатком начальной загрузки является то, что каждая итерация должна работать с выборкой, которая так же велика, как исходный набор данных (который может быть вычислительно дорогостоящим), в то время как некоторые другие методы выборки могут работать с гораздо меньшими выборками.

Эта статья предполагает, что наивное сокращение размера выборки может снизить производительность по сравнению с загрузкой пакетов на основе бутстрапа, что может быть причиной для этого. В документе также представлен новый метод использования меньших выборок в оценках упаковки, избегая при этом этих проблем.

Дэвид Дж. Харрис
источник