繁体   English   中英

基于AUC的R随机森林特征选择

[英]R random forest feature selection based on AUC

对于二元期权预测(上升,下降),我尝试使用R中的随机森林,但在我的情况下,重要性指标和OOB有偏差

我找到了这篇文章,但它与Python有关。

是否有用于自动特征选择的R包方法

  • 基于AUC
  • 也许可以让我定义自己的评估函数(赚到的钱是召回率和准确率的函数)
  • 也许允许我指定交叉验证方法:随机选择训练和测试用例是有偏见的,因为有时间序列数据,其中测试数据必须晚于训练数据

我刚遇到这个问题,我发现此软件包可能对您有帮助:

一世。 它称为AUCRF,它基于优化AUC在随机森林模型中执行特征选择。 https://cran.r-project.org/web/packages/AUCRF/AUCRF.pdf

II。 它确实允许对基于AUC的选择AUCRFcv(x,nCV = 5,M = 20)进行交叉验证

其中nCV是折叠数,M =重复数。

III。 关于允许您自己评估,它确实有一个选项,您可以在其中使用〜指定公式,但是由于您未提供测试代码,因此您将不得不针对特定情况进行更多研究。

希望这可以帮助!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM