使用 sklearn 的 cross_val_score 和不同的訓練和測試數據集

Question

我有一個關於以下簡短代碼片段的快速問題（我的 sklearn 版本，從中導入 cross_val_score 和 LinearDiscriminantAnalysis，是 1.1.1）：

cv_results = cross_val_score(LinearDiscriminantAnalysis(),data,isTarget,cv=kfold,scoring='accuracy')

我正在嘗試在“數據”變量和“isTarget”變量上訓練 LinearDiscriminantAnalysis ML 算法，它們是我的 ML 數據集中樣本特征的 numpy 數組，以及哪些樣本是目標 (1) 或非目標的列表目標（0），恭敬。 kfold 只是對算法進行評分的一種方法，在這里並不重要。

我的問題是這樣的：我試圖通過在“數據”和“isTarget”上訓練它來給這個算法打分，但我想在不同的數據集“data_val”和“isTarget_val”上測試它，但cross_val_score沒有參數用於在一個數據集上訓練算法並在另一個數據集上進行測試。 我一直在尋找可以做到這一點的其他功能，我覺得這是一個非常簡單的答案，我就是找不到。

有人可以幫我嗎？ 謝謝：）

Answer 1

這就是交叉驗證的設計方式。 您提供的cv參數指定您要進行 K 折交叉驗證，這意味着您的整個數據集將用於 K 不同折中的訓練和測試。

您可以在此處閱讀有關交叉驗證的更多信息。

Answer 2

您可以使用PredefinedSplit ( docs ) 作為cv參數來完成此操作。

使用 sklearn 的 cross_val_score 和不同的訓練和測試數據集

問題描述

2 個解決方案

解決方案1
1 已采納 2022-06-17 18:29:20

解決方案2
1 2022-06-19 03:35:53

使用 sklearn 的 cross_val_score 和不同的訓練和測試數據集

問題描述

2 個解決方案

解決方案1 1 已采納 2022-06-17 18:29:20

解決方案2 1 2022-06-19 03:35:53

解決方案1
1 已采納 2022-06-17 18:29:20

解決方案2
1 2022-06-19 03:35:53