簡體   English   中英

SVM 的 C++ 數據

[英]C++ data for SVM

我將使用 openCV 的 (C++) SVM(支持向量機)進行分類。 但是有個問題:

特征向量太大了(每個有 1890000 個元素),我有超過 10000 個特征向量來訓練 SVM。 如何操作特征向量或使用它們而不會遇到內存問題?

對於如此高的維度和如此多的訓練樣本,您將需要大量內存才能使用任何流行的 SVM 實現。 如果我要面對這個問題,那么我至少會考慮以下選項之一:

  • 減少每個向量的維度,有很多算法可以做到這一點,但 PCA 是一個好的開始。
  • 在一些具有大量內存的主機上獲取計算時間(也許亞馬遜 ec2 實例之一就足夠了)
  • 使用 SVM 的線性在線近似進行測試。 在高維中,您很可能可以線性地分離類,並且您可以使用 SVM在線近似值,然后一次只加載一個樣本到內存中,在這種情況下,您不需要那么多內存(我會為此考慮 pegasos-svm)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM