繁体   English   中英

如何解释我的随机森林回归准确度数据?

[英]How do I interpret my Random Forest Regression accuracy data?

我有一个数据集来根据推文情绪分析加密货币价格,并且我正在使用随机森林回归。 我的利率是好还是坏? 我如何解释它们? 在此处输入图像描述

您的 rmse 约为 100,与平均硬币价格 4400 相比,误差不大。我认为您可以继续进行更广泛或更准确的预测。 也许您也可以使用其他数据验证您的 model。

然而,这真的取决于你想要的目标。 如果目标是做高频交易,2%的误差会非常大。 如果您的目标是将 RF model 设置为基础,我认为这是一个很好的开始。

虽然这是一项预测任务,但可能需要先检查推文和加密货币价格之间的相关性,以便确保这两个变量之间有足够的统计关系(分类变量与区间变量的相关性方法可能会有所帮助)。

平均绝对误差实际上是您的预测与“真实”值之间的平均“距离”。 均方误差是距离平方的平均值。 正如您从代码中看到的那样,RMSE 是均方误差的平方根。

在 MAE 的情况下,它对“水平”事物很有用。 如何? 百分比或分数。 MAE/np.mean(y_test) 但根据您使用的数据,您可以使用 np.max(y_test) 或 np.min(y_test)。

MSE 不那么宽容,因为它是二次缩放的,因此对于每个“误差单位”,这基本上会增长得更快。

因此,MSE 和 RMSE 都赋予更大的误差更多的权重。 通常,您可以比较运行之间的 RMSE 分数,改进会更加明显,我通常使用 RMSE 作为评分器来最小化,因为当您使用 MAE 时,小的偏差可能只是 RF 中随机性的一部分。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM