Я пытаюсь запустить xgboost в scikit learn. И я использую только Pandas для загрузки данных в dataframe. Как я должен использовать панд DF с xgboost. Меня смущает процедура DMatrix, необходимая для запуска алгоритма xgboost.
scikit-learn
pandas
xgboost
Призрак в доспехах
источник
источник
xgb.DMatrix(X_train.values, y_train.values)
я вижуTypeError: can not initialize DMatrix from dict
.values
)Есть хорошие новости, что есть библиотека,
pandas_ml
которая поддерживает XGBoost, возможно, это просто упростит рабочий процесс.http://pandas-ml.readthedocs.io/en/latest/xgboost.html
источник
Теперь вы можете использовать Pandas DataFrames напрямую с XGBoost. Определенно работает с xgboost 0.81.
Например, где X_train, X_val, y_train и y_val являются кадрами данных:
источник