[英]difference between classification and regression in k-nearest neighbor? [closed]
在分类中使用 K 近邻和在回归中使用它有什么区别?
以及在推荐系统中使用 KNN 时。 它涉及分类还是回归?
在分类任务中,用户寻求预测一个category
,通常表示为整数标签,但代表“事物”的类别。 例如,您可以尝试将图片分为“猫”和“狗”,并使用标签 0 表示“猫”,使用标签 1 表示“狗”。
用于分类的 KNN 算法将查看您尝试对其进行预测的输入的 k 个最近邻。 然后它将输出这 k 个示例中出现频率最高的标签。
在回归任务中,用户希望输出一个数值(通常是连续的)。 例如,它可能是估计房屋的价格,或对电影的好坏进行评估。
在这种情况下,KNN 算法将从您要进行预测的示例中收集与 k 个最接近的示例相关联的值,并将它们聚合以输出单个值。 通常,您会选择邻居的 k 值的平均值,但您可以选择中位数或加权平均值(或实际上任何对您手头的任务有意义的东西)。
对于您的特定问题,您可以同时使用两者,但回归对我来说更有意义,以便预测用户和您想推荐给他的事物之间的某种“匹配百分比”。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.