Я подхожу к модели с многовариантным множителем, и R требует очень много времени, чтобы соответствовать этой модели. Почему это?
Например, если я подгоняю регрессию к прогнозированию зарплат игроков и включаю предиктор факторов для всех национальностей игроков, это займет больше времени, чем подгонка модели для зарплат игроков с непрерывным предиктором, таким как игроки. высоты.
regression
categorical-data
goldisfine
источник
источник
Ответы:
Типично R - как и большинство пакетов статистики, для регрессии используется QR-декомпозиция.
Для фиксированного , где , просто вычисление самого разложения эффективно квадратично по - удвоение числа предикторов умножит время вычисления примерно на 4.N р < < п п
Поэтому, если вы перейдете от (линейная регрессия) к , вы ожидаете, что это займет что-то в области в 600 раз дольше (в действительности, возможно, несколько меньше, по разным причинам).р = 2 р = 50
Таким образом, добавление большого количества предсказателей будет означать значительно более длительное ожидание.
источник
источник