繁体   English   中英

partykit:回归树-识别终端节点盒图中的异常值

[英]partykit: regression tree - identify outliers in terminal node boxplots

使用以下代码创建的回归树具有所有终端节点的箱形图。 箱线图显示中位数,IQR和离群值,这很好。

plot(as.party(tree), terminal_panel = node_boxplot)

但是,如何确定箱图中的异常值? 我认为,既然已经创建了箱线图,应该相对容易地取出异常值,但是信息似乎并没有存储在树中。 我知道我可以按照树的路径来识别数据集中的离群值,但我想知道是否有更快的方法可以做到这一点。

由于您不提供数据,因此我将使用内置cars数据来完成此操作。
没错,此信息似乎没有存储在树中。 而且,该图没有提供有意义的回报。 至少一种实现方法是使用boxplot重做boxplot然后获得异常值。

library(rpart)
library(partykit)

CarTree = rpart(dist ~ ., data=cars)
PCT = as.party(CarTree)
P = plot(PCT, terminal_panel = node_boxplot)

BP = boxplot(cars$dist ~ PCT[1]$fitted[[1]])
BP$out
[1] 80

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM