簡體   English   中英

使用 sklearn 的 cross_val_score 和不同的訓練和測試數據集

[英]Using sklearn's cross_val_score with different training and testing datasets

我有一個關於以下簡短代碼片段的快速問題(我的 sklearn 版本,從中導入 cross_val_score 和 LinearDiscriminantAnalysis,是 1.1.1):

cv_results = cross_val_score(LinearDiscriminantAnalysis(),data,isTarget,cv=kfold,scoring='accuracy')

我正在嘗試在“數據”變量和“isTarget”變量上訓練 LinearDiscriminantAnalysis ML 算法,它們是我的 ML 數據集中樣本特征的 numpy 數組,以及哪些樣本是目標 (1) 或非目標的列表目標(0),恭敬。 kfold 只是對算法進行評分的一種方法,在這里並不重要。

我的問題是這樣的:我試圖通過在“數據”和“isTarget”上訓練它來給這個算法打分,但我想在不同的數據集“data_val”和“isTarget_val”上測試它,但cross_val_score沒有參數用於在一個數據集上訓練算法並在另一個數據集上進行測試。 我一直在尋找可以做到這一點的其他功能,我覺得這是一個非常簡單的答案,我就是找不到。

有人可以幫我嗎? 謝謝 :)

這就是交叉驗證的設計方式。 您提供的cv參數指定您要進行 K 折交叉驗證,這意味着您的整個數據集將用於 K 不同折中的訓練和測試。

您可以在此處閱讀有關交叉驗證的更多信息。

您可以使用PredefinedSplit ( docs ) 作為cv參數來完成此操作。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM