繁体   English   中英

获得R中连续变量的随机森林预测精度

[英]Getting random forest prediction accuracy for a continuous variable in R

我试图用随机森林预测R的连续变量(计数)。 预测变量的值是min=1max=1000

我尝试用“confusionMatrix”获得预测准确度,但自然地我得到了预测和预测之间不同级别的错误。

在这些情况下获得预测准确性的最佳方法是什么?

@ mishakob

粗略地说,均方根误差可以理解为实际值和拟合值之间的归一化偏差。 它可以如下获得。

library(randomForest)
set.seed(1237)
iris.rg <- randomForest(Sepal.Length ~ ., data=iris, importance=TRUE,
                        proximity=TRUE)

sqrt(sum((iris.rg$predicted - iris$Sepal.Length)^2) / nrow(iris))
[1] 0.3706187

randomForest应该只显示分类结果的混淆矩阵,因此请尝试确保结果是数字的。 然后,这将显示均方残差。 例如:

library(randomForest)
# This is probably what you're seeing
randomForest(as.factor(Sepal.Length) ~ Sepal.Width, data=iris)
# This is what you want to see
randomForest(Sepal.Length ~ Sepal.Width, data=iris)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM