[英]Discrete and Continuous Classifier on Sparse Data
我试图对一个包含离散和连续特征的例子进行分类。 此外,该示例表示稀疏数据,因此即使系统可能已经训练了100个特征,该示例可能仅具有12个。
用于实现此目的的最佳分类器算法是什么? 我一直在关注贝叶斯,Maxent,决策树和KNN,但我不确定是否符合这个法案。 我发现最大的问题是大多数实现都不支持稀疏数据集以及离散和连续特性。 任何人都可以推荐符合这些标准的算法和实现(最好是在Python中)吗?
到目前为止我看过的图书馆包括:
Weka (Java)满足您的所有要求:
查看此Pentaho wiki,获取文档,指南,视频教程等链接列表......
scikit-learn ,Python机器学习模块支持稀疏数据的随机梯度下降和支持向量机 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.