繁体   English   中英

随机状态参数在随机森林算法中的重要性是什么?

[英]What is the importance of random-state parameter in random forest algorithm?

随机森林有几个参数之一,它们是随机状态。 我不知道它是做什么的,以及它对RF算法的重要性。

随机森林不过是套在决策树上的套袋而已,我们需要随机数来生成适合树的随机样本(自举样本)。 但是我们这里可能会有问题,每次您生成一组随机数时,程序都会生成完全不同的一组随机数,这再次影响您的引导程序样本,进而影响所安装的树。 因此,为了控制随机数生成所涉及的随机性,并在每次使用随机种子时复制同一组随机数。 random_state是一个参数,它允许您为随机森林中的随机数生成过程设置随机种子。

关于为什么需要设置随机种子的一个主要原因是为了实验的可复制性。 最好设置一个随机种子,然后开始构建模型,以便每次使用相同数据构建模型时,都获得完全相同的模型。

设置随机种子的想法不仅限于随机森林,任何需要随机数的算法(神经网络,决策树等)都将具有此参数。

希望这可以帮助!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM