我正在尝试在相当大的数据集上使用 scikit learn 中的 k 个最近邻实现。 问题是预测需要很长时间,几乎和没有意义的训练一样长。 这是算法的问题,还是 scikit learn 不适用于大型数据集(不支持 GPU)的事实。 有关更多信息,我正在尝试根据 x、y、z 和对象标签预测激光雷达 ...
提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供 中文繁体 英文版本 中英对照 版本,有任何建议请联系yoyou2525@163.com。
我想知道确定回归数字类别的5个属性的最佳优化。 K最近邻回归是最好的回归方法,但是如何基于此回归方法获得可靠的结果(如数值结果中属性的最佳值)?
有几种方法可以执行此操作,具体取决于您使用的软件类型。 您可能想首先确定K-NN回归是否真的是满足您需求的最佳算法,并假设您没有过拟合等。为了首先给出某种意义,可能需要某种类型的主成分分析(PCA)或其他分析属性优先级。
在Weka中,您可以通过将LinearNNSearch方法嵌入(包装)到IBk学习器中来做到这一点。 实际上,您允许算法通过重复的,保留一出的交叉验证过程来优化邻居数。 有关如何执行此操作的说明,位于:
http://infochim.u-strasbg.fr/CS3/program/Tutorials/Tutorial2a.pdf
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.