![](/img/trans.png)
[英]Python sci-kit learn (metrics): difference between r2_score and explained_variance_score?
[英]What's the difference between using libSVM in sci-kit learn, or e1070 in R, for training and using support vector machines?
最近,我正在考虑使用R或Python来训练支持向量机的选择。
除了两种编程语言固有的优点和缺点之外,我想知道是否有任何启发式指南可根据软件包本身来决定采用哪种方法。
我在考虑模型的训练速度,可伸缩性,不同内核的可用性以及其他与性能相关的方面。
给定一些不同大小的数据集,如何决定采用哪条路径?
对于这个可能含糊的问题,我预先表示歉意。
我对e1070并没有经验,但是从谷歌搜索来看,它似乎是在使用还是基于LIBSVM(我不知道足够多的R来确定cran条目中的哪个)。 Scilearnkit还使用LIBSVM。
在这两种情况下,模型都将由LIBSVM进行训练。 速度,可伸缩性,可用的各种选项将完全相同,并且在将SVM与这些库一起使用时,您将面临的主要限制是LIBSVM的限制。
我认为,除非您在问题中澄清两点,否则很难提供进一步的建议:您的目标是什么? 您已经知道LIBSVM吗? 这是一个学习项目吗? 谁在为您付出时间? 您对Python还是R感到更舒服?
有时我有同样的问题。 是的,e1070和scikit-learn都使用LIBSVM。 我只有e1070的经验。
但是有些地方R
更好 。 过去我曾读过Python无法正确处理分类功能(至少不是开箱即用)。 对于某些人来说,这可能是一件大事。
我也更喜欢R的formula
界面。 还有一些不错的数据处理包。
Python对于通用编程绝对是更好的选择,而scikit-learn
帮助将单一编程语言用于所有任务。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.