繁体   English   中英

无需改装即可在SciKit-Learn GradientBoostingClassifier中删除零重要性功能

[英]Zero Importance Feature Removal Without Refit in SciKit-Learn GradientBoostingClassifier

在SciKit-Learn中安装GradientBoostingClassifier后,某些功能的重要性为零。

我的理解是,重要性为零将意味着不会对此功能进行拆分。

如果我尝试使用不包含功能的数据集进行预测,则由于没有所有功能而会引发错误。

当然,我意识到我可以删除零重要性功能,但是我宁愿不更改已经适合的模型。 (如果删除零重要性功能并进行改装,我会得到一个略有不同的模型。)

这是模型需要零重要性功能进行预测的错误,还是我没有考虑的零重要性功能? 是否有解决方法以获得完全相同的模型?

(我正在预见一个问题,为什么这很重要-这是因为要求零重要性功能意味着从一个非常大的数据库中提取更多列,并且在模型中包含不执行任何操作的功能看起来很草率。)

这不是错误,而是预期的行为。 在对模型进行了培训之后,Scikit不会做出关于应该包含或不包含哪些功能的假设。

相反,当您调用fit模型时,会隐式假定您已经执行了特征选择,以删除对模型不重要的特征。 拟合后,无论特征是否重要,您都将提供与拟合模型相同大小的数据集。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM