繁体   English   中英

Java机器学习功能排名/评分回归

[英]Machine Learning Feature Ranking/Scoring for Regression in Java

对于类值是连续数字而不是二进制的回归数据集,Java中是否有任何功能评分方法?

ML-Lib 功能评分似乎仅适用于分类数据集。

这在很大程度上取决于您的回归算法。 对于线性分类器,基于内核的回归算法的良好功能可能会很糟糕。 https://en.wikipedia.org/wiki/Feature_selection )您似乎针对“过滤器方法”。 在许多回归设置中,最有效的是Pearson Correlation ML-Lib中也提供此功能。

但是,您应该考虑不添加K个最相关的功能,而是

  1. 避免选择高度相关的特征对。 因此,您必须在所有特征对之间建立相关矩阵。
  2. 选择顶部特征,构建回归模型,测量模型的误差,测量误差与其余特征之间的相关性。 这将贪婪地选择最佳功能
  3. 选择功能后,应考虑进行敏感性分析。 这是针对所有要素以及已删除一个要素的所有要素集建立回归模型。 如果删除没有重大影响,则可以删除它。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM