繁体 English 中英

通过 Pearson 相关性或随机森林中的特征重要性进行特征选择

[英]Feature selection by Pearson correlation or Feature importance in Random Forest

原文 2022-02-03 15:10:11 6 1 python/ machine-learning

我有点困惑； 我有一个数据集，其中一个特征与目标变量的关系最不重要，但是，在评估特征重要性之后。 它显示了与目标变量最显着的关系，如图所示，在下图中，名为“diff”的变量是目标。 并且称为“小时”的变量是独立特征？ 是否有可能一个特征基于 Pearson 相关性显示出最不显着的关系，但基于特征重要性显示出最显着的关系，如果是这样？ 那么哪一个是特征选择的参考呢？ 皮尔逊相关性或特征重要性？ 皮尔逊相关与特征重要性

1 个解决方案

我认为这是可能的。 相关性量化了线性关系。 这两个变量可能不是线性关系，因此显示出较低的相关系数。 这并不意味着没有任何关系。 可能存在二次、三次等关系。 这种非线性关系可能是基于树的 model 的许多决策的基础，因此获得了较高的重要性分数。 我建议查看这两个功能的 plot。 散点图可以揭示非线性关系。 至于使用哪个分数：功能重要性特定于您的 model。 如果您打算坚持使用基于树的 model ，请使用它。 如果您计划使用线性 model，则相关性可以让您对有用的功能有一个不错的了解，对于非线性 model，它们可能不是很好。

随机森林特征重要性 Python

[英]Random Forest Feature Importance Python

在多输出随机森林回归器中获得特征重要性

[英]Getting Feature importance in multioutput random forest regressor

使用 Python 的随机森林特征重要性图表

[英]Random Forest Feature Importance Chart using Python

随机森林中每个特征级别的重要性顺序

[英]Order of importance for each level of a feature in Random Forest

如何在 python 中对随机森林的 plot 特征重要性

[英]How to plot feature importance for random forest in python

随机森林特征重要性鲁棒性与 Python

[英]Random Forest Feature Importance Robustness with Python

Python中随机森林回归器的功能重要性

[英]Feature Importance for Random Forest Regressor in Python

随机森林回归器特征重要性全为零

[英]Random Forest Regressor Feature Importance all zero

使用 Python 的随机森林特征重要性

[英]Random Forest Feature Importance using Python

随机森林特征重要性与相关矩阵

[英]Random Forest Feature Importances vs Correlation Matrix

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 随机森林特征重要性 Python 在多输出随机森林回归器中获得特征重要性使用 Python 的随机森林特征重要性图表随机森林中每个特征级别的重要性顺序如何在 python 中对随机森林的 plot 特征重要性随机森林特征重要性鲁棒性与 Python Python中随机森林回归器的功能重要性随机森林回归器特征重要性全为零使用 Python 的随机森林特征重要性随机森林特征重要性与相关矩阵

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM