如何在 sklearn 中運行 10 折交叉驗證后運行 SVC 分類器？

Question

我對機器學習比較陌生，希望在以下方面得到一些幫助：

我使用 10 折交叉驗證對我的數據運行了支持向量機分類器 (SVC)，並計算了准確率得分（大約 89%）。 我正在使用 Python 和 scikit-learn 來執行任務。 這是一個代碼片段：

def get_scores(features,target,classifier):
  X_train, X_test, y_train, y_test =train_test_split(features, target , 
    test_size=0.3)
    scores = cross_val_score(
    classifier,
    X_train,
    y_train,
    cv=10,
    scoring='accuracy',
    n_jobs=-1)
 return(scores)

get_scores(features_from_df,target_from_df,svm.SVC())

現在，我如何使用我的分類器（在運行 10 倍 cv 之后）在 X_test 上對其進行測試並將預測結果與 y_test 進行比較？ 您可能已經注意到，我在交叉驗證過程中只使用了 X_train 和 y_train。

我注意到 sklearn 有 cross_val_predict: http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_predict.html我應該用 cross_val_predict 替換我的 cross_val_score 嗎？ 僅供參考：我的目標數據列已二值化（值為 0 和 1）。

如果我的方法是錯誤的，請告訴我最好的方法。

謝謝！

Answer 1

您只需要拆分X和y。 不要拆分火車並進行測試。

然后，您可以將案例svm中的分類器傳遞給cross_val_score函數，以獲取每個實驗的准確性。

僅用三行代碼：

clf = svm.SVC(kernel='linear', C=1)
scores = cross_val_score(clf, X, y, cv=10)
print scores

Answer 2

你快到了：

# Build your classifier
classifier = svm.SVC()

# Train it on the entire training data set
classifier.fit(X_train, y_train)

# Get predictions on the test set
y_pred = classifier.predict(X_test)

此時，您可以使用sklearn.metrics模塊中的任何指標來確定您的表現如何。 例如：

from sklearn.metrics import accuracy_score
print(accuracy_score(y_test, y_pred))

Answer 3

from sklearn.metrics import classification_report
classifier = svm.SVC()
classifier.fit(X_train, y_train)
y_pred = classifier.predict(X_test)
print(classification_report(y_test , y_pred)

如何在 sklearn 中運行 10 折交叉驗證后運行 SVC 分類器？

問題描述

3 個解決方案

解決方案1
3 2018-10-02 20:12:27

解決方案2
0 已采納 2017-12-05 23:39:26

解決方案3
-1 2022-12-09 14:15:23

如何在 sklearn 中運行 10 折交叉驗證后運行 SVC 分類器？

問題描述

3 個解決方案

解決方案1 3 2018-10-02 20:12:27

解決方案2 0 已采納 2017-12-05 23:39:26

解決方案3 -1 2022-12-09 14:15:23

解決方案1
3 2018-10-02 20:12:27

解決方案2
0 已采納 2017-12-05 23:39:26

解決方案3
-1 2022-12-09 14:15:23