繁体   English   中英

R中RPart图中的乱码输出

[英]Gibberish Output in RPart plot in R

我正在尝试使用R中的RPart在具有26个变量的数据集上运行决策树,以将结果分类为0或1。该模型的公平精度为81%,当我继续绘制树时,我得到非常乱的变量拆分值。 例如:v10包含国家/地区清单,例如美国,英国,印度等,但此处显示的图表为一些荒谬的值。 v7是一个URL列表,v12是我的数据集中的一些定量数字,但是树值看起来很糟。 使用RPart的决策树

该算法将每个因子的级别替换为字母中的小写和大写字母。 如果一个因子中有超过56个水平,则重复Z字母,因此不建议将具有超过56个水平的因子用作rpart模型的输入。

但是,可以避免出现不必要的“乱码”输出:如果使用plot()+ text(),请尝试在text()函数中使用“ pretty”参数。 例:

plot(tree)
text(tree, pretty=1)

其他输出函数为此具有其特定参数。 例如,“ labels()”具有“ minlength”参数:

labels(tree)
labels(tree,minlength=0)

希望对您有所帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM