![](/img/trans.png)
[英]How to choose C and gamma AFTER grid search using libSVM (RBF kernel) for best possible generalisation?
[英]Are high values for c or gamma problematic when using an RBF kernel SVM?
通常,您必须执行交叉验证以回答参数是否正确或是否导致过度拟合。
从“直觉”的角度来看 - 它似乎是高度过度拟合的模型。 高伽马值意味着你的高斯非常狭窄(在每个尖端周围凝聚),结合高C值将导致记忆大部分训练集。 如果您查看支持向量的数量,如果它是您整个数据的50%,我不会感到惊讶。 其他可能的解释是您没有扩展数据。 大多数ML方法,尤其是SVM,需要对数据进行适当的预处理 。 这尤其意味着您应该对输入数据进行标准化 (标准化),以使其或多或少地包含在单位范围内。
RBF似乎是一个合理的选择,所以我会继续使用它。 高价值的伽玛不是一件坏事,它取决于你的数据所在的规模。 虽然高C值可能导致过度拟合,但它也会受到比例的影响,因此在某些情况下它可能会很好。
如果您认为您的数据集是整个数据的良好表示,那么您可以使用交叉验证来测试您的参数并让您高枕无忧。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.