[英]How do I convert an “RWeka” decision tree into a “party” tree in R?
我正在R中使用RWeka软件包,以使用“ M5P”将M5'树适合数据集。 然后,我想将生成的树转换为“派对”树,以便可以访问变量的重要性。 我遇到的问题是,在没有出现以下错误的情况下,我似乎无法使as.party
函数as.party
工作:
"Error: all(sapply(split, head, 1) %in% c("<=", ">")) is not TRUE"
仅当我在for循环中应用函数时才会出现此错误,但是当我运行5倍交叉验证时,for循环是必需的。
下面是我一直在运行的代码:
n <- nrow(data)
k <- 5
indCV <- sample( rep(1:k,each=ceiling(n/k)), n)
for(i in 1:k){
#Training data is for all the observations where indCV is not equal to i
training_data <- data.frame(x[-which(indCV==i),])
training_response <- y[-which(indCV==i)]
#Test the data on the fifth of the data where the observation indices are equal to i
test_data <- x[which(indCV==i),]
test_response <- y[which(indCV==i)]
#Fit a pruned model to the training data
fit <- M5P(training_response~., data=training_data, control=Weka_control(N=TRUE))
#Convert to party
p <- as.party(fit)
}
RWeka
软件包提供了一个将M5P
树转换为party
对象的示例。 如果您运行example("M5P", package = "RWeka")
那么example("M5P", package = "RWeka")
可视化实际上是由partykit
绘制的。 运行示例之后,请参见plot(m3)
和as.party(m3)
。
但是,尽管对于J48
您可以获得完整的constparty
对象,但对于M5P
并非如此。 在后一种情况下,树结构本身可以转换为party
但是节点内的线性模型转换为lm
对象并非完全简单。 因此,如果要使用参与party
表示来计算仅取决于树结构的度量(例如,用于拆分的变量,拆分数,拆分点等),则可以这样做。 但是,如果您要计算依赖于模型或预测的度量(例如均方误差等),那么party
类将无济于事。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.