簡體   English   中英

R: - 模型/變量長度不一致 - 隨機森林

[英]R: - Error in model/variable lengths differ - random forest

我正在嘗試構建一個隨機森林,但無論我如何努力處理NA並重新構建我的數據,我都會繼續得到同樣的錯誤,因為這似乎是導致此錯誤的最常見原因。 但它仍然存在,我無法運行我的模型。

  ##Prepare data for random forest
Comprr<-Compr
Comprr$Mudster<-ifelse(Comprr$verifikation <10,'good','ok')
Comprr$Mudster[Comprr$verifikation==10]<-'restricted'
Comprr$Mudster<-as.factor(Comprr$Mudster)
table(Comprr$Mudster)

##Separate test and train data 
set.seed(123)
samp<-sample(nrow(Comprr),0.6 * nrow(Comprr))
train<-Comprr[samp, ]
test<-Comprr[-samp, ]
na.roughfix(Comprr)
##Building the model
library(randomForest)
model<-randomForest(Comprr$Mudster~ . -verifikation,data = train)

這是代碼的相關部分,這是它返回的錯誤消息

Error in model.frame.default(formula = Mudster ~ . - verifikation, data = train,  : 
  variable lengths differ (found for 'message'

)這是不管變量我試圖一次一個地清除它們,直到我意識到它更基本的東西。 非常感謝您的幫助! 提前致謝

嘗試在RF模型行之前運行此操作

名稱(Comprr)< - make.names(名稱(Comprr))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM