簡體 English 中英

了解機器學習的交叉驗證

[英]Understanding Cross Validation for Machine learning

原文 2020-09-21 17:58:59 6 1 python/ validation/ data-science/ cross-validation

以下關於交叉驗證的說法正確嗎？：

訓練數據被分成不同的組，除一個訓練數據集外，所有訓練數據集都用於訓練 model。一旦訓練了 model，“遺漏”的訓練數據將用於執行超參數調整。 一旦選擇了最佳超參數，測試數據將應用於 model 以給出結果，然后將其與經歷過類似過程但具有不同訓練數據集組合的其他模型進行比較。 然后選擇在測試數據上具有最佳結果的 model。

1 個解決方案

我不認為這是正確的。 你寫了：

一旦 model 被訓練，“遺漏”訓練數據用於執行超參數調整

您通過選擇（手動或使用網格搜索或隨機搜索等方法）一組模型的超參數（您設置值的參數，甚至在您將 model 擬合到數據之前）來調整 model。 然后，對於一組選定的超參數值，您可以使用交叉驗證計算驗證集誤差。

所以它應該是這樣的：

訓練數據分為不同的組，除了一個訓練數據集外，所有訓練數據集都用於訓練 model。一旦訓練了 model，“遺漏”的訓練數據用於...

...計算誤差。 在交叉驗證結束時，您將在 k 個遺漏集上計算出 k 個錯誤。 您接下來要做的是計算這 k 個錯誤的平均值，這會為您提供一個值 - 驗證集錯誤。

如果你有 n 組超參數，你只需重復該過程 n 次，這會給你 n 個驗證集錯誤。 然后你選擇這個給你最小驗證錯誤的集合。

最后，您通常會計算測試集誤差以查看模型在未見數據上的性能如何，模擬將 model 投入生產並查看測試集誤差和驗證集誤差之間是否存在差異。 如果存在顯着差異，則意味着過擬合。

只是在交叉驗證本身上添加一些東西，我們使用 k-CV 或 LOOCV 的原因是它是很好的測試集錯誤估計，這意味着當我使用超參數進行操作並且驗證集錯誤的值下降時，我知道我真的改進了 model 而不是幸運，只是更好地使 model 適合訓練集。

如何在沒有交叉驗證的情況下檢查機器學習的准確性

[英]How to check machine learning accuracy without cross validation

如何從正常的機器學習技術轉變為交叉驗證？

[英]How to change from normal machine learning technique to cross validation?

理解機器學習中的主成分分析

[英]understanding pca in machine learning

使用交叉驗證來確定機器學習算法的權重（GridSearchCv、RidgeCV、StackingClassifier）

[英]Using cross-validation to determine weights of machine learning algorithms (GridSearchCv,RidgeCV,StackingClassifier)

使用 kfold 交叉驗證進行深度學習

[英]deep learning with kfold cross validation

了解 fbprophet cross_validation

[英]understanding fbprophet cross_validation

了解機器學習過程和Kfold交叉驗證

[英]Understanding machine learning process and Kfold crossvalidation

在留一法交叉驗證中，我如何使用 `shap.Explainer()` 函數來解釋機器學習模型？

[英]In Leave One Out Cross Validation, How can I Use `shap.Explainer()` Function to Explain a Machine Learning Model?

如何在機器學習模型中使用train.csv，test.csv和ground_truth.csv？（交叉驗證/ python）

[英]How to use a train.csv , test.csv and ground_truth.csv in a machine learning model? (cross validation/ python)

持續驗證精度高，機器學習損失高

[英]Constant Validation Accuracy with a high loss in machine learning

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在沒有交叉驗證的情況下檢查機器學習的准確性如何從正常的機器學習技術轉變為交叉驗證？理解機器學習中的主成分分析使用交叉驗證來確定機器學習算法的權重（GridSearchCv、RidgeCV、StackingClassifier）使用 kfold 交叉驗證進行深度學習了解 fbprophet cross_validation 了解機器學習過程和Kfold交叉驗證在留一法交叉驗證中，我如何使用 `shap.Explainer()` 函數來解釋機器學習模型？如何在機器學習模型中使用train.csv，test.csv和ground_truth.csv？（交叉驗證/ python）持續驗證精度高，機器學習損失高

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM