繁体   English   中英

回归树还是分类树? 多个分类输入和数字输出

[英]Regression Tree or Classification tree? multiple categorical inputs and numeric output

它在统计文档中说:分类树给出了名义上的响应,例如“真”或“假”。 回归树给出数字响应。 我正在尝试构建决策树。 我正在处理数字(输出)和非数字数据(输入)。我认为分类树比回归树更合适,或者(因为回归树似乎只适用于数字数据)。 是否可以使用非数字数据来预测数字数据?如果是这样,我怎么能在 R 中做到这一点?分类树适合是正确的选择吗?

谢谢 :)

术语“数字响应”有点笼统。 Numeric 可以是取值从 0 到无穷大的变量(例如,用户数、金额、距离),但也可以是取值 1 或 0(表示是/否、男性/女性),甚至值 1,2,3(代表选择 1、选择 2、选择 3)。 最好将第一种情况描述为尺度/连续变量,将第二种情况描述为二元变量,将第三种情况描述为分类变量。

第一种情况可以通过回归树(基于连续变量的数字响应)来处理,其他两种可以通过分类树(分类变量响应;它们可能会返回分类值或每个分类值的概率。这取决于您) .

检查这些开始: http : //www.statmethods.net/advstats/cart.htmlhttp://www.rdatamining.com/docs/regression-and-classification-with-r

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM