簡體   English   中英

支持SVM預測大量數據

[英]SVM prediction for large amount of data

我想針對相對大量的數據(150M)運行SVM分類(具有二進制響應)。 因此,我采樣了一個訓練數據集(說大約50,000個),並在R使用svm{e1071}建立了模型。 現在,我想將結果應用於整個數據集。 我不知道如何在R加載和運行這么大的數據集。 因此,我需要從R提取模型參數並在另一個平台上運行它。 換句話說,我想為整個數據獲得相同的weight.svm (概率):

model.svm = svm(as.factor(response) ~.,data=predictors, probability=TRUE) 
predict.svm= predict(model.svm,predictors,probability=TRUE)
weight.svm = data.frame(attr(predict.svm,"probabilities"))

有什么建議嗎? 是否有任何簡單的文本/參考說明了此預測功能在SVM中的工作方式? 我應該從model.svm對象中提取哪些值,例如model.svm$SV等?

如果您的內核是線性的,則可以使用Pegasos算法 您可以在本文的第7頁中找到該算法,該算法少於10行代碼,是解決SVM優化問題的最快算法之一。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM