[英]scikit-learn preperation
我正在尝试使用scikit-learn
包进行半监督分类,我有一个包含类、实例和特征的文件,但我不确定如何为scikit-learn
准备这个文件。 你能给一些文件准备的指导吗? 本教程仅提供有关从机器学习存储库上传准备好的数据集的说明。 谢谢!
Scikit-learn 直接支持特殊的面向学习的输入格式,特别是SVMLight 。 但总的来说,它的输入是一个 numpy 数组(密集时),可以使用 SciPy 堆栈中的其他工具(特别是scipy.io )从各种数据源生成,并且在文本文件的情况下更相关列, Pandas IO 工具。 您可能可以使用pandas.read_csv然后从特征集中提取和删除目标类列。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.