繁体 English 中英

如何使用libSVM（RBF内核）选择C和gamma AFTER网格搜索以获得最佳可能的推广？

[英]How to choose C and gamma AFTER grid search using libSVM (RBF kernel) for best possible generalisation?

原文 2014-09-10 19:17:28 5 1 machine-learning/ kernel/ svm/ libsvm/ cross-validation

我知道有很多问题要求为SVM选择“最佳”C和gamma值（RBF内核）。 标准答案是网格搜索，但是，我的问题在网格搜索结果之后开始。 让我解释：

我有一个10个主题的数据集，我在其上执行假一个主题xfold验证意味着我对每个左外主题执行网格搜索。 为了不对此训练数据进行优化，我不希望通过在所有10个模型上建立平均精度来选择最佳C和伽玛参数，并搜索最大值。 考虑到xfold中的一个模型，我只能对该模型的训练数据执行另一个xfold（不涉及遗漏的验证主题）。 但你可以想象计算工作量，我没有足够的时间用于此。

由于对10个模型中的每个模型的网格搜索 产生了大范围的良好C和伽马参数（精度差异仅为2-4％，见图1），我想到了一种不同的方式。

我在网格中定义了一个区域，该区域仅包含与该网格的最大精度相差2％的精度。 差值高于2％的所有其他精度值均设置为零（参见图2）。 我为每个模型执行此操作，并在每个模型的区域之间构建交叉。 这导致C和γ值的小得多的区域将产生在最大值的2％内的精度。 每种型号的准确性。 但是，范围仍然很大。 所以我考虑选择具有最低C的C-gamma对，因为这意味着我距离过度拟合最远，并且更接近于良好的泛化。 我能这样说吗？

我通常如何在这个C-gamma对区域中选择C和gamma，这些都证明了我的分类器在所有10个模型中的可靠调整？ 我应该专注于最小化C参数吗？ 或者我应该专注于最小化C和伽马参数？

我在这里找到了一个相关的答案（当使用RBF内核SVM时，c或gamma的值是否有问题？）说高C和高gamma的组合意味着过度拟合。 我知道伽玛的值会改变数据点周围的高斯曲线的宽度，但我仍然无法理解它在数据集中的实际意义。

这篇文章让我想到了另一个想法。 我可以使用与数据点数量相关的SV数作为标准来在所有C-gamma对之间进行选择吗？ 较低（SV数/数据点数）是否意味着更好的推广？ 我愿意放松准确性，因为它不应该影响我感兴趣的结果，如果我得到更好的概括（至少从理论的角度来看）。

网格搜索后的平衡公告

遵循我的地区并与标准相交的均衡公告

1 个解决方案

由于线性内核是rbf内核的特例。 有一种使用线性SVM首先调整C的方法。 然后双线性调整CG对以节省时间。

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.141.880&rep=rep1&type=pdf

使用具有最佳C和Gamma的libsvm训练数据

[英]train data using libsvm with best C and Gamma

使用RBF内核SVM时，c或gamma的高值是否有问题？

[英]Are high values for c or gamma problematic when using an RBF kernel SVM?

在templateSVM中为RBF内核设置伽马值

[英]Setting gamma value for RBF kernel in templateSVM

在libsvm中训练时间并过度使用gamma和C

[英]training time and overfitting with gamma and C in libsvm

如何在使用带有RBF内核的SVM的系统之间进行适当的比较？

[英]How to conduct a proper comparison between systems using SVM with RBF kernel?

RBF和SVM多项式内核的参数选择-两个内核的最佳“ c”（成本参数）是否相同？

[英]Parameter selection for RBF and polynomial kernel of SVM - Is the best 'c' (Cost parameter) same for both kernels?

优化C，g参数时LIBSVM中的网格搜索错误

[英]Grid search error in LIBSVM while optimizing C, g parameters

如何使用libsvm matlab固定参数cost和gamma以提高准确性？

[英]how can fixed parameters cost and gamma using libsvm matlab to improve accuracy?

在libsvm中使用我自己的内核

[英]Using my own kernel in libsvm

使用 RBF 内核进行 SVR 推理的方程式是什么？

[英]What is the equation for SVR inference using an RBF kernel?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用具有最佳C和Gamma的libsvm训练数据使用RBF内核SVM时，c或gamma的高值是否有问题？在templateSVM中为RBF内核设置伽马值在libsvm中训练时间并过度使用gamma和C 如何在使用带有RBF内核的SVM的系统之间进行适当的比较？ RBF和SVM多项式内核的参数选择-两个内核的最佳“ c”（成本参数）是否相同？优化C，g参数时LIBSVM中的网格搜索错误如何使用libsvm matlab固定参数cost和gamma以提高准确性？在libsvm中使用我自己的内核使用 RBF 内核进行 SVR 推理的方程式是什么？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM