簡體 English 中英

如何使用libSVM（RBF內核）選擇C和gamma AFTER網格搜索以獲得最佳可能的推廣？

[英]How to choose C and gamma AFTER grid search using libSVM (RBF kernel) for best possible generalisation?

原文 2014-09-10 19:17:28 6 1 machine-learning/ kernel/ svm/ libsvm/ cross-validation

我知道有很多問題要求為SVM選擇“最佳”C和gamma值（RBF內核）。 標准答案是網格搜索，但是，我的問題在網格搜索結果之后開始。 讓我解釋：

我有一個10個主題的數據集，我在其上執行假一個主題xfold驗證意味着我對每個左外主題執行網格搜索。 為了不對此訓練數據進行優化，我不希望通過在所有10個模型上建立平均精度來選擇最佳C和伽瑪參數，並搜索最大值。 考慮到xfold中的一個模型，我只能對該模型的訓練數據執行另一個xfold（不涉及遺漏的驗證主題）。 但你可以想象計算工作量，我沒有足夠的時間用於此。

由於對10個模型中的每個模型的網格搜索 產生了大范圍的良好C和伽馬參數（精度差異僅為2-4％，見圖1），我想到了一種不同的方式。

我在網格中定義了一個區域，該區域僅包含與該網格的最大精度相差2％的精度。 差值高於2％的所有其他精度值均設置為零（參見圖2）。 我為每個模型執行此操作，並在每個模型的區域之間構建交叉。 這導致C和γ值的小得多的區域將產生在最大值的2％內的精度。 每種型號的准確性。 但是，范圍仍然很大。 所以我考慮選擇具有最低C的C-gamma對，因為這意味着我距離過度擬合最遠，並且更接近於良好的泛化。 我能這樣說嗎？

我通常如何在這個C-gamma對區域中選擇C和gamma，這些都證明了我的分類器在所有10個模型中的可靠調整？ 我應該專注於最小化C參數嗎？ 或者我應該專注於最小化C和伽馬參數？

我在這里找到了一個相關的答案（當使用RBF內核SVM時，c或gamma的值是否有問題？）說高C和高gamma的組合意味着過度擬合。 我知道伽瑪的值會改變數據點周圍的高斯曲線的寬度，但我仍然無法理解它在數據集中的實際意義。

這篇文章讓我想到了另一個想法。 我可以使用與數據點數量相關的SV數作為標准來在所有C-gamma對之間進行選擇嗎？ 較低（SV數/數據點數）是否意味着更好的推廣？ 我願意放松准確性，因為它不應該影響我感興趣的結果，如果我得到更好的概括（至少從理論的角度來看）。

網格搜索后的平衡公告

遵循我的地區並與標准相交的均衡公告

1 個解決方案

由於線性內核是rbf內核的特例。 有一種使用線性SVM首先調整C的方法。 然后雙線性調整CG對以節省時間。

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.141.880&rep=rep1&type=pdf

使用具有最佳C和Gamma的libsvm訓練數據

[英]train data using libsvm with best C and Gamma

使用RBF內核SVM時，c或gamma的高值是否有問題？

[英]Are high values for c or gamma problematic when using an RBF kernel SVM?

在templateSVM中為RBF內核設置伽馬值

[英]Setting gamma value for RBF kernel in templateSVM

在libsvm中訓練時間並過度使用gamma和C

[英]training time and overfitting with gamma and C in libsvm

如何在使用帶有RBF內核的SVM的系統之間進行適當的比較？

[英]How to conduct a proper comparison between systems using SVM with RBF kernel?

RBF和SVM多項式內核的參數選擇-兩個內核的最佳“ c”（成本參數）是否相同？

[英]Parameter selection for RBF and polynomial kernel of SVM - Is the best 'c' (Cost parameter) same for both kernels?

優化C，g參數時LIBSVM中的網格搜索錯誤

[英]Grid search error in LIBSVM while optimizing C, g parameters

如何使用libsvm matlab固定參數cost和gamma以提高准確性？

[英]how can fixed parameters cost and gamma using libsvm matlab to improve accuracy?

在libsvm中使用我自己的內核

[英]Using my own kernel in libsvm

使用 RBF 內核進行 SVR 推理的方程式是什么？

[英]What is the equation for SVR inference using an RBF kernel?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 使用具有最佳C和Gamma的libsvm訓練數據使用RBF內核SVM時，c或gamma的高值是否有問題？在templateSVM中為RBF內核設置伽馬值在libsvm中訓練時間並過度使用gamma和C 如何在使用帶有RBF內核的SVM的系統之間進行適當的比較？ RBF和SVM多項式內核的參數選擇-兩個內核的最佳“ c”（成本參數）是否相同？優化C，g參數時LIBSVM中的網格搜索錯誤如何使用libsvm matlab固定參數cost和gamma以提高准確性？在libsvm中使用我自己的內核使用 RBF 內核進行 SVR 推理的方程式是什么？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM