繁体   English   中英

如何为决策树的连续特征选择拆分变量

[英]How to choose a split variables for continous features for decision tree

我目前正在实施决策树算法。 如果我有连续的特色数据,我该如何决定分裂点。 我遇到了一些资源,它们说要在每两点之间选择中间点,但考虑到我有8000行数据,这将是非常耗时的。 输出/特征标签具有类别数据。 是否可以更快地执行此操作

决策树用于计算熵和信息增益以确定最重要的特征。 实际上,对于决策树而言,8000行并不算太多。 但一般来说,随机森林类似于决策树。 它作为整体工作。 您可以查看并尝试它。此外,可能慢慢地与另一件事有关。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM