[英]Predictive model decision tree
我想使用R中的決策樹分類來構建預測模型。我使用了以下代碼:
library(rpart)
library(caret)
DataYesNo <- read.csv('DataYesNo.csv', header=T)
summary(DataYesNo)
worktrain <- sample(1:50, 40)
worktest <- setdiff(1:50, worktrain)
DataYesNo[worktrain,]
DataYesNo[worktest,]
M <- ncol(DataYesNo)
input <- names(DataYesNo)[1:(M-1)]
target <- “YesNo”
tree <- rpart(YesNo~Var1+Var2+Var3+Var4+Var5,
data=DataYesNo[worktrain, c(input,target)],
method="class",
parms=list(split="information"),
control=rpart.control(usesurrogate=0, maxsurrogate=0))
summary(tree)
plot(tree)
text(tree)
我只有一個根( Var3
)和兩個葉子( yes
, no
)。 我不確定這個結果。 如何獲得混淆矩陣,准確性,敏感性和特異性? 我可以用caret
包裝獲得它們嗎?
如果使用模型對測試集進行預測,則可以使用confusionMatrix()
來獲取所需的度量。
像這樣
predictions <- predict(tree, worktest)
cmatrix <- confusionMatrix(predictions, worktest$YesNo)
print(cmatrix)
創建混亂矩陣后,還可以獲得其他度量-我暫時不記得它們。
根據您的示例,可以如下獲得混淆矩陣。
fitted <- predict(tree, DataYesNo[worktest, c(input,target)])
actual <- DataYesNo[worktest, c(target)]
confusion <- table(data.frame(fitted = fitted, actual = actual))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.