[英]Is there a way to get the instances used for classification in random forest tree in R?
[英]Random Forest Tree for classification
data <- read.csv("appstore_games.csv")
data <- data %>% drop_na()
data <- data %>% select(Average.User.Rating, User.Rating.Count, Price, Age.Rating, Genres)
data <- data %>% separate(Genres, c("Main Genre","Genre1","Genre2","Genre3"), extra = "drop" )
data1 <- data %>% select(Genre1 , Average.User.Rating, User.Rating.Count, Price )
str(data1)
data1$Genre1 <- as.factor(data1$Genre1)
set.seed(123)
sample <- sample(2 , nrow(data1),replace = TRUE, prob = c(0.7,0.3))
train_data <- data1[sample == 1,]
test_data <- data1[sample == 2,]
library(randomForest)
set.seed(1)
rf <- randomForest(train_data$Genre1 ~., data = train_data , proximity = TRUE, ntree = 200, importance = TRUE)
此時顯示錯誤 randomForest.default(m, y, ...) 中的錯誤:y 中不能有空類。
我能知道這里有什么問題嗎? 謝謝 該類型有策略,娛樂等名稱
我不完全確定,但我認為如果不是所有不同級別的 Y 都在火車數據中表示,則可能會發生這種情況。 也許你檢查一下。
我的另一個想法是,您在 Y 中的一個課程是“無”。
train_data <- droplevels(train_data) 在將數據傳遞給 model 之前嘗試使用它
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.