簡體   English   中英

獲得R中連續變量的隨機森林預測精度

[英]Getting random forest prediction accuracy for a continuous variable in R

我試圖用隨機森林預測R的連續變量(計數)。 預測變量的值是min=1max=1000

我嘗試用“confusionMatrix”獲得預測准確度,但自然地我得到了預測和預測之間不同級別的錯誤。

在這些情況下獲得預測准確性的最佳方法是什么?

@ mishakob

粗略地說,均方根誤差可以理解為實際值和擬合值之間的歸一化偏差。 它可以如下獲得。

library(randomForest)
set.seed(1237)
iris.rg <- randomForest(Sepal.Length ~ ., data=iris, importance=TRUE,
                        proximity=TRUE)

sqrt(sum((iris.rg$predicted - iris$Sepal.Length)^2) / nrow(iris))
[1] 0.3706187

randomForest應該只顯示分類結果的混淆矩陣,因此請嘗試確保結果是數字的。 然后,這將顯示均方殘差。 例如:

library(randomForest)
# This is probably what you're seeing
randomForest(as.factor(Sepal.Length) ~ Sepal.Width, data=iris)
# This is what you want to see
randomForest(Sepal.Length ~ Sepal.Width, data=iris)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM