[英]Machine Learning Using Scikit-Learn & SVM
从sklearn.datasets
模块加载流行数字数据集并将其分配给可变数字。
将digits.data
分成两组名称X_train
和X_test
。 此外,将 digits.target 分成两组Y_train
和Y_test
。
提示:使用 sklearn.model_selection 中的sklearn.model_selection
train_test_split()
方法; 将random_state
设置为 30; 并进行分层抽样。 使用默认参数从X_train
集和Y_train
标签构建 SVM 分类器。 将 model 命名为svm_clf
。
在测试数据集上评估 model 的准确性并打印其分数。 我使用了以下代码:
import sklearn.datasets as datasets
import sklearn.model_selection as ms
from sklearn.model_selection import train_test_split
digits = datasets.load_digits();
X = digits.data
y = digits.target
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=30)
print(X_train.shape)
print(X_test.shape)
from sklearn.svm import SVC
svm_clf = SVC().fit(X_train, y_train)
print(svm_clf.score(X_test,y_test))
我得到以下 output。
(1347,64)
(450,64)
0.4088888888888889
但是我无法通过测试。 有人可以帮忙解决问题吗?
您缺少分层抽样要求; 修改您的拆分以包含它:
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=30, stratify=y)
检查文档。
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=30, stratify=y)
即使在使用它之后它也没有通过
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.