如何通过“信息增益”获得 xgboost 中的特征重要性？

Question

我们可以通过“权重”获得特征重要性：

model.feature_importances_

但这不是我想要的。 我想要通过信息获取的重要性。

我们可以通过“增益”图获得特征重要性：

xgboost.plot_importance(model, importance_type='gain')

但是，我不知道如何从上面的图中获取特征重要性数据。 或者

如果有像model.feature_importances_这样的model.feature_importances_来获得特征重要性？ 这两种方式中的任何一种都可以。 如果问题不清楚，请在评论中告诉我

Answer 1

你可以从

model.booster().get_score(importance_type='gain')

Answer 2

实际上，我对您的问题有点不清楚，但我仍然会尝试回答这个问题。

我想你需要像特征选择这样的东西。 如果我是对的，那么您可以检查 sklearn.feature_selection。

有很多重要的函数，如 chi2、SelectKBest、mutual_info_classif、f_regression、mutual_info_regression 等。

Answer 3

在当前版本的 Xgboost 中，重要性的默认类型是gain ，请参阅文档中的importance_type 。

也可以使用scikit-learn包中的permutation_importance或SHAP值来计算特征重要性。 您可以在我的这篇博文中阅读有关在 Xgboost 中计算特征重要性的替代方法的详细信息。