支持SVM預測大量數據

Question

我想針對相對大量的數據（150M）運行SVM分類（具有二進制響應）。 因此，我采樣了一個訓練數據集（說大約50,000個），並在R使用svm{e1071}建立了模型。 現在，我想將結果應用於整個數據集。 我不知道如何在R加載和運行這么大的數據集。 因此，我需要從R提取模型參數並在另一個平台上運行它。 換句話說，我想為整個數據獲得相同的weight.svm （概率）：

model.svm = svm(as.factor(response) ~.,data=predictors, probability=TRUE) 
predict.svm= predict(model.svm,predictors,probability=TRUE)
weight.svm = data.frame(attr(predict.svm,"probabilities"))

有什么建議嗎？ 是否有任何簡單的文本/參考說明了此預測功能在SVM中的工作方式？ 我應該從model.svm對象中提取哪些值，例如model.svm$SV等？

Answer 1

如果您的內核是線性的，則可以使用Pegasos算法。 您可以在本文的第7頁中找到該算法，該算法少於10行代碼，是解決SVM優化問題的最快算法之一。

支持SVM預測大量數據

問題描述

1 個解決方案

解決方案1
0 2016-03-28 17:50:53

支持SVM預測大量數據

問題描述

1 個解決方案

解決方案1 0 2016-03-28 17:50:53

解決方案1
0 2016-03-28 17:50:53