用於分類的隨機森林樹

Question

我第一次嘗試射頻。 我正在嘗試根據因素預測游戲的類型

data <- read.csv("appstore_games.csv")
data <- data %>% drop_na()
data <- data %>% select(Average.User.Rating, User.Rating.Count, Price, Age.Rating, Genres)
data <- data %>% separate(Genres, c("Main Genre","Genre1","Genre2","Genre3"), extra = "drop" )
data1 <- data %>% select(Genre1 , Average.User.Rating, User.Rating.Count, Price )
str(data1)
data1$Genre1 <- as.factor(data1$Genre1)
set.seed(123)
sample <- sample(2 , nrow(data1),replace = TRUE, prob = c(0.7,0.3))
train_data <- data1[sample == 1,]
test_data <- data1[sample == 2,]
library(randomForest)
set.seed(1)
rf <- randomForest(train_data$Genre1 ~., data = train_data , proximity = TRUE, ntree = 200, importance = TRUE)

此時顯示錯誤 randomForest.default(m, y, ...) 中的錯誤：y 中不能有空類。

我能知道這里有什么問題嗎？ 謝謝該類型有策略，娛樂等名稱

Answer 1

我不完全確定，但我認為如果不是所有不同級別的 Y 都在火車數據中表示，則可能會發生這種情況。 也許你檢查一下。

我的另一個想法是，您在 Y 中的一個課程是“無”。

Answer 2

train_data <- droplevels(train_data) 在將數據傳遞給 model 之前嘗試使用它

用於分類的隨機森林樹

問題描述

2 個解決方案

解決方案1
2 2020-05-01 14:20:27

解決方案2
2 2020-05-06 18:49:25

用於分類的隨機森林樹

問題描述

2 個解決方案

解決方案1 2 2020-05-01 14:20:27

解決方案2 2 2020-05-06 18:49:25

解決方案1
2 2020-05-01 14:20:27

解決方案2
2 2020-05-06 18:49:25