繁体 English 中英

使用RBF内核SVM时，c或gamma的高值是否有问题？

[英]Are high values for c or gamma problematic when using an RBF kernel SVM?

原文 2014-04-30 14:41:46 3 2 machine-learning/ nlp/ svm

我正在使用WEKA / LibSVM来训练术语提取系统的分类器。 我的数据不是线性可分的，因此我使用RBF内核而不是线性内核。
我遵循了Hsu等人的指南。 并迭代c和gamma的几个值。 最适合分类已知术语（测试和训练材料当然不同）的参数相当高，c = 2 ^ 10且γ= 2 ^ 3。
到目前为止，高参数似乎工作正常，但我想知道它们是否会进一步导致任何问题，特别是在过度拟合方面。 我计划通过提取新术语来进行另一次评估，但由于我需要人类评判，这些评估费用很高。
即使两个评估结果都是肯定的，我的参数仍然有问题吗？ 我可能还需要其他内核类型吗？

非常感谢你！

2 个解决方案

通常，您必须执行交叉验证以回答参数是否正确或是否导致过度拟合。

从“直觉”的角度来看 - 它似乎是高度过度拟合的模型。 高伽马值意味着你的高斯非常狭窄（在每个尖端周围凝聚），结合高C值将导致记忆大部分训练集。 如果您查看支持向量的数量，如果它是您整个数据的50％，我不会感到惊讶。 其他可能的解释是您没有扩展数据。 大多数ML方法，尤其是SVM，需要对数据进行适当的预处理 。 这尤其意味着您应该对输入数据进行标准化 （标准化），以使其或多或少地包含在单位范围内。

RBF似乎是一个合理的选择，所以我会继续使用它。 高价值的伽玛不是一件坏事，它取决于你的数据所在的规模。 虽然高C值可能导致过度拟合，但它也会受到比例的影响，因此在某些情况下它可能会很好。

如果您认为您的数据集是整个数据的良好表示，那么您可以使用交叉验证来测试您的参数并让您高枕无忧。

如何使用libSVM（RBF内核）选择C和gamma AFTER网格搜索以获得最佳可能的推广？

[英]How to choose C and gamma AFTER grid search using libSVM (RBF kernel) for best possible generalisation?

使用scikit-learn的SVM分类算法（RBF内核）时出现意外结果

[英]Unexpected results when using scikit-learn's SVM classification algorithm (RBF kernel)

SVM，scikit-learn：RBF内核的决策值

[英]SVM, scikit-learn: Decision values with RBF kernel

SVM 自定义 RBF 内核 IndexError

[英]SVM custom RBF kernel IndexError

如何在使用带有RBF内核的SVM的系统之间进行适当的比较？

[英]How to conduct a proper comparison between systems using SVM with RBF kernel?

查找C和gamma的值以优化SVM

[英]Finding the values of C and gamma to optimise SVM

在templateSVM中为RBF内核设置伽马值

[英]Setting gamma value for RBF kernel in templateSVM

OpenCV中的SVM：具有RBF内核的低精度OCR

[英]SVM in OpenCV: low accuracy OCR with RBF kernel

Sklearn SVM 自定义rbf核函数

[英]Sklearn SVM custom rbf kernel function

RBF和SVM多项式内核的参数选择-两个内核的最佳“ c”（成本参数）是否相同？

[英]Parameter selection for RBF and polynomial kernel of SVM - Is the best 'c' (Cost parameter) same for both kernels?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何使用libSVM（RBF内核）选择C和gamma AFTER网格搜索以获得最佳可能的推广？使用scikit-learn的SVM分类算法（RBF内核）时出现意外结果 SVM，scikit-learn：RBF内核的决策值 SVM 自定义 RBF 内核 IndexError 如何在使用带有RBF内核的SVM的系统之间进行适当的比较？查找C和gamma的值以优化SVM 在templateSVM中为RBF内核设置伽马值 OpenCV中的SVM：具有RBF内核的低精度OCR Sklearn SVM 自定义rbf核函数 RBF和SVM多项式内核的参数选择-两个内核的最佳“ c”（成本参数）是否相同？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM