![](/img/trans.png)
[英]Python sci-kit learn (metrics): difference between r2_score and explained_variance_score?
[英]What's the difference between using libSVM in sci-kit learn, or e1070 in R, for training and using support vector machines?
最近,我正在考慮使用R或Python來訓練支持向量機的選擇。
除了兩種編程語言固有的優點和缺點之外,我想知道是否有任何啟發式指南可根據軟件包本身來決定采用哪種方法。
我在考慮模型的訓練速度,可伸縮性,不同內核的可用性以及其他與性能相關的方面。
給定一些不同大小的數據集,如何決定采用哪條路徑?
對於這個可能含糊的問題,我預先表示歉意。
我對e1070並沒有經驗,但是從谷歌搜索來看,它似乎是在使用還是基於LIBSVM(我不知道足夠多的R來確定cran條目中的哪個)。 Scilearnkit還使用LIBSVM。
在這兩種情況下,模型都將由LIBSVM進行訓練。 速度,可伸縮性,可用的各種選項將完全相同,並且在將SVM與這些庫一起使用時,您將面臨的主要限制是LIBSVM的限制。
我認為,除非您在問題中澄清兩點,否則很難提供進一步的建議:您的目標是什么? 您已經知道LIBSVM嗎? 這是一個學習項目嗎? 誰在為您付出時間? 您對Python還是R感到更舒服?
有時我有同樣的問題。 是的,e1070和scikit-learn都使用LIBSVM。 我只有e1070的經驗。
但是有些地方R
更好 。 過去我曾讀過Python無法正確處理分類功能(至少不是開箱即用)。 對於某些人來說,這可能是一件大事。
我也更喜歡R的formula
界面。 還有一些不錯的數據處理包。
Python對於通用編程絕對是更好的選擇,而scikit-learn
幫助將單一編程語言用於所有任務。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.