繁体   English   中英

SVM 的 C++ 数据

[英]C++ data for SVM

我将使用 openCV 的 (C++) SVM(支持向量机)进行分类。 但是有个问题:

特征向量太大了(每个有 1890000 个元素),我有超过 10000 个特征向量来训练 SVM。 如何操作特征向量或使用它们而不会遇到内存问题?

对于如此高的维度和如此多的训练样本,您将需要大量内存才能使用任何流行的 SVM 实现。 如果我要面对这个问题,那么我至少会考虑以下选项之一:

  • 减少每个向量的维度,有很多算法可以做到这一点,但 PCA 是一个好的开始。
  • 在一些具有大量内存的主机上获取计算时间(也许亚马逊 ec2 实例之一就足够了)
  • 使用 SVM 的线性在线近似进行测试。 在高维中,您很可能可以线性地分离类,并且您可以使用 SVM在线近似值,然后一次只加载一个样本到内存中,在这种情况下,您不需要那么多内存(我会为此考虑 pegasos-svm)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM