[英]Uncertainty in target feature in machine learning
好的,假设我有一个包含一些特征的数据集,比如说 X,目标 Y 有一个错误(因为这是一个实验测量,它有不确定性),在训练一些机器时我应该如何处理这个问题学习回归算法? X 和 Y 都是连续的。
RMSE 是否说明了我在没有错误信息的情况下训练的模型的预测值的误差? 还是我应该使用另一个指标来计算误差? 我不记得这些东西背后的统计数据,所以,你们可以推荐我读的东西。
我做的第一件事是忽略 Y 的误差并尝试拟合“粗” X 和 Y,获取模型并给出一些指标(比如我认为可行的 RMSE),获取我的预测误差,但我认为这是不对的。
那么,我应该如何处理有错误的数据集以创建更准确的模型? 以及如何获取我的预测的错误信息?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.