[英]Interpret R output Rpart classification tree surrogate splits
Surrogate splits:
## bmi < 21.51 to the right, agree=0.858, adj=0.632, (0 split)
据我所知,这种拆分根据bmi值<21.51将案例发送到正确的子节点,并且与主要变量(一致= 0.858)具有相似的分割,并且节点杂质(adj = 0.632)的体面减少。
我不明白输出的(0分割)片段? 此外,如果协议的值为1,这是否可疑?
谢谢!
如果您的第一个主要分裂中有10个缺失,那么rpart将尝试使用代理分割对它们进行分类。 如果你的第一个代理变量中有9个是非缺失的,那么rpart将使用这个变量,你将在你的rpart输出旁边有这个代理变量(9 split) ,因为变量用于9个分裂。
如果您的代理变量也缺少数据,那么您的输出中将有(0分割) 。
我不知道协议的确切计算,但如果你有一个1的协议,那么我猜测代理变量导致与使用主变量时相同的分类。 如果您的代理变量是例如主变量的单调变换版本,则可能发生这种情况。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.