簡體   English   中英

邏輯 model 的混淆矩陣

[英]confusion matrix for a logistic model

我的數據包括使用分類和非分類觀察對兩種 Microtus 進行區分

我從 89 個樣本中構建了一個邏輯 model,用於預測剩余 199 個樣本的組成員資格

我的數據樣本

Group           M1      M2      Fora    Phone   len     height  Rost
1   multiplex       2078    1649    1708    3868    5463    2355    805
2   subterraneus    1749    1482    1462    3797    4855    2218    765 
3   unknown         1841    1562    1585    3750    5024    2232    821

我將數據分成 89 個觀測值來訓練我的 model 並保留 199 個未知觀測值來預測

train.data = microtus[c(1:89),c(1:9)]
test.data = microtus[c(90:288),c(1:9)]
train.data$Group =ifelse(train.data$Group=="multiplex", 1, 0)

我的 Model

model <- glm(Group ~ M1Left + M3Left + Foramen + Length + Height, 
    family = binomial(), data = train.data)
summary(model)

預測

pred <- predict(model, test.data, type = "response")

我建立了一個混淆矩陣

createConfusionMatrix=function(actual, preds){
  predClass=ifelse(preds<0.5, 0, 1)

  table(actual,predClass)
}
## Confusion matrix 
createConfusionMatrix(test.data$Group,pred)

我的 output

              predClass
actual           0   1
  multiplex      0   0
  subterraneus   0   0
  unknown       70 129

這個 output 對我來說似乎不對?

我可以獲得有關如何構建混淆矩陣的幫助嗎?

您的代碼正在運行(使用您共享的數據):

#Code
i <- sample(1:3,288,replace = T)
#Data
microtus <- df[i,]
#Split
train.data = microtus[c(1:89),]
test.data = microtus[c(90:288),]
train.data$Group =ifelse(train.data$Group=="multiplex", 1, 0)
#Model
model <- glm(Group ~ M1 + M2 + Fora + len + height, 
             family = binomial(), data = train.data)
#Predict
test.data$pred <- predict(model, test.data, type = "response")
#Check
createConfusionMatrix=function(actual, preds){
  predClass=ifelse(preds<0.5, 0, 1)
  
  table(actual,predClass)
}
## Confusion matrix 
createConfusionMatrix(test.data$Group,test.data$pred)

Output:

              predClass
actual          0  1
  multiplex     0 75
  subterraneus 57  0
  unknown      67  0

使用的一些數據:

#Data
df <- structure(list(Group = c("multiplex", "subterraneus", "unknown"
), M1 = c(2078L, 1749L, 1841L), M2 = c(1649L, 1482L, 1562L), 
    Fora = c(1708L, 1462L, 1585L), Phone = c(3868L, 3797L, 3750L
    ), len = c(5463L, 4855L, 5024L), height = c(2355L, 2218L, 
    2232L), Rost = c(805L, 765L, 821L)), class = "data.frame", row.names = c("1", 
"2", "3"))

也許開始一個新的 session 再試一次。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM