繁体 English 中英

R中随机森林的类别重要性

[英]class importance for random forest in r

原文 2015-03-17 12:01:22 3 1 r/ classification/ random-forest

我在R中使用randomForest pkg根据11个数字预测变量预测二进制类。 出了两班， Hit或Miss ，类Hit是更重要的，也就是我想知道有多少次正确预测Hit 。

有没有一种方法可以使Hit在训练随机森林方面具有更高的重要性？ 目前，训练有素的随机森林仅正确预测了7％的Hit病例，并且肯定需要改进。

1 个解决方案

更高的重要性？ 我不知道如何告诉任何算法“这次我不是在开玩笑 ：我希望这种分析是准确的。”

您一直在努力应对差异与偏见。 如果您过多地提高了训练准确性，则可能会出现过度拟合的风险。

您可以通过更改预测变量的随机样本的大小来调整随机森林。 如果您有m个预测变量，则对于树中的分割数，随机森林的建议为p = m ^ 1/2。 您还可以改变树木的数量。 为p的不同值绘制测试分类错误与＃树的关系，以了解您的操作方式。

您还可以尝试其他算法，例如gbm （广义增强回归模型）或支持向量机

绘制数据时，数据看起来如何？ 当您在散点图中查看任何明显的小组时，您会跳出来吗？

无论使用哪种算法，建议您对模型进行n折验证。

R - 解释随机森林的重要性

[英]R - Interpreting Random Forest Importance

在 R 中访问随机森林中每个元素的重要性

[英]Accessing Importance of each element in Random Forest in R

R-随机森林-重要性/ varImPlot

[英]R- Random Forest - Importance / varImPlot

在R Plot随机森林模型的重要性变量

[英]in R Plot importance variables of Random Forest model

随机森林问题的重要性

[英]Random Forest issues with Importance

scikit-learn中R随机森林特征重要性得分的实现

[英]implementation of R random forest feature importance score in scikit-learn

为什么重要性参数会影响 R 中随机森林的性能？

[英]Why does the importance parameter influence performance of Random Forest in R?

重要性（随机森林）和RandomForest $重要性之间的区别

[英]Difference between Importance(random forest) and RandomForest$importance

R中随机森林中的二元分类或未知类

[英]Binary classification or unknown class in random forest in R

如何使用R在随机森林中生成决策树图和变量重要性图？

[英]How do I generate a Decision Tree plot and a Variable Importance plot in Random Forest using R?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 R - 解释随机森林的重要性在 R 中访问随机森林中每个元素的重要性 R-随机森林-重要性/ varImPlot 在R Plot随机森林模型的重要性变量随机森林问题的重要性 scikit-learn中R随机森林特征重要性得分的实现为什么重要性参数会影响 R 中随机森林的性能？重要性（随机森林）和RandomForest $重要性之间的区别 R中随机森林中的二元分类或未知类如何使用R在随机森林中生成决策树图和变量重要性图？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM