我想知道确定回归数字类别的5个属性的最佳优化。 K最近邻回归是最好的回归方法,但是如何基于此回归方法获得可靠的结果(如数值结果中属性的最佳值)?

#1楼 票数:0

有几种方法可以执行此操作,具体取决于您使用的软件类型。 您可能想首先确定K-NN回归是否真的是满足您需求的最佳算法,并假设您没有过拟合等。为了首先给出某种意义,可能需要某种类型的主成分分析(PCA)或其他分析属性优先级。

在Weka中,您可以通过将LinearNNSearch方法嵌入(包装)到IBk学习器中来做到这一点。 实际上,您允许算法通过重复的,保留一出的交叉验证过程来优化邻居数。 有关如何执行此操作的说明,位于:

http://infochim.u-strasbg.fr/CS3/program/Tutorials/Tutorial2a.pdf

  ask by tio juno translate from so

未解决问题?本站智能推荐:

2回复

OrangeCanvas3.3.6-运行k-means集群小部件时出现“MemoryError”

我在Orange 3.3.6中运行k-means集群小部件时遇到问题。 我试图在具有46k行的数据集上运行它,但是我一直收到内存错误,并且小部件崩溃。 如果将其减少到12030行,它将运行。 显然,我希望它在整个数据集上运行。 我尝试安装最新版本的orange,除我真正需要的少数列外,
2回复

橙色画布:不给出多元回归系数

我正在使用Orange画布来处理caotic数据集。 我想得到一个回归方程,我使用单变量多项式回归工具,它给出了相关的图,但它没有给出任何关于它的方程或系数。 是否有任何方法,小部件工具或代码在Orange中导入此功能。 谢谢大家。
1回复

K最近邻居问题

嗨,我在尝试在代码中实现K最近邻居算法时遇到了麻烦。 我正在R中实现此功能,但只想了解其工作原理,因此我对代码的关注程度不像对过程那样担心。 我将发布我所拥有的,我的数据以及我的问题是什么: 到目前为止,在我的代码中: 为此,我使用以下公式计算“距离”: 那么其余算法的过程如下:
1回复

K最近邻居验证性能

我正在使用knn对电信问题进行分类。 我将数据分为70%的训练和30%的验证。 尽管knn分类器在训练中能够在2个十分之一中捕获超过80%的数据,但其在验证样本中的表现却好于随机45度线。 令我感到惊讶的是,KNN如何工作,以至于模型在训练和验证中的表现是如此不同。 有指针吗?
1回复

如何在jgrapht中获得最近邻居

我正在尝试使用jgraphT解决链接预测问题。 我正在基于两个节点的邻居计算两个节点之间的相似性。 每个节点都有一些属性。 计算过多,因为一些节点有大约700个邻居,我有4500个这样的节点。 我有700K的边缘,我计算相似度。 现在,我不想使用节点的所有邻居,而是希望仅使用每个节点
2回复

每个类别的k个最近邻分类器训练样本大小

有人可以告诉我每个班级的训练样本量是否需要相等? 我可以采取这种情况吗? 还是所有类的样本量均应相等?
1回复

橙色逻辑回归不返回系数

从Orange docs( http://docs.orange.biolab.si/reference/rst/Orange.classification.logreg.html )中,我正在尝试从这部分代码中复制结果: 进口橙 titanic = Orange.data.Table(
1回复

如何在Orange中将回归截距设置为0

我使用橙色库在python中编写了波纹管回归代码,但是 我需要将intercept设置为零,我找到了这段代码 在此页面中: http : //orange.biolab.si/docs/latest/reference/rst/Orange.regression.linear.html,