簡體 English 中英

對特征選擇預處理進行交叉驗證的動機是什么？

[英]What is the motivation for cross validation on feature selection preprocessing?

原文 2020-04-03 16:06:55 8 1 machine-learning/ cross-validation/ feature-selection

我看到了幾篇關於特征選擇（包裝器和嵌入式方法）的文章和示例，它們將樣本數據拆分為訓練集和測試集。

我理解為什么我們需要使用交叉驗證（將數據拆分為訓練和測試集）來構建和測試模型的分數（提議算法的實際預測）。

但我不明白這樣做的動機是什么？

我們需要選擇哪些特征並沒有真實的結果，那么如何改進特征選擇的過程呢？

有什么好處？

1 個解決方案

大多數特征選擇方法，例如包裝模型，都需要比較模型在使用不同特征組合下的性能。

交叉驗證提供了一種更穩健的方法來比較使用不同特征子集時的性能，因此提供了更穩健的特征選擇過程。 例如，如果使用 K-folds 交叉驗證，則比較將基於來自不同數據折疊的誤差的平均值，因此，選擇將導致最小泛化誤差的子集。

此外，對於不同的特征組合，最優超參數不一定相同。 交叉驗證有助於調整，因此是更公平的比較。

這也是有關此主題的信息資源。

特征選擇和交叉驗證

[英]feature selection and cross validation

如何在 weka 中做這些：交叉驗證+不平衡數據+特征選擇

[英]How to do these in weka: cross validation + imbalanced data + feature selection

如何在 sklearn 的交叉驗證中執行特征選擇（rfecv）

[英]How to perform feature selection (rfecv) in cross validation in sklearn

在進行特征選擇時，CfsSubsetEvaluator在交叉驗證的每個步驟中選擇特征時使用多少個標准和/或使用什么標准？

[英]How many and/or what criteria does CfsSubsetEvaluator use in selecting features in each step of cross-validation while doing feature selection?

交叉驗證和模型選擇

[英]Cross validation and model selection

sklearn：使用交叉驗證進行遞歸特征消除的好處是什么？

[英]sklearn: What is the Benefit of Recursive Feature Elimination With Cross-Validation?

R mlr-包裝器功能選擇+超參數調整，而沒有嵌套嵌套的交叉驗證？

[英]R mlr - Wrapper feature selection + hyperparameter tuning without nested-nested cross validation?

交叉驗證是分類中的特征選擇

[英]Cross Validation is Feature Selecting in Classification

LDA交叉驗證和變量選擇

[英]LDA cross validation and variable selection

model 選擇是否使用交叉驗證？

[英]Is cross validation used for model selection?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 特征選擇和交叉驗證如何在 weka 中做這些：交叉驗證+不平衡數據+特征選擇如何在 sklearn 的交叉驗證中執行特征選擇（rfecv）在進行特征選擇時，CfsSubsetEvaluator在交叉驗證的每個步驟中選擇特征時使用多少個標准和/或使用什么標准？交叉驗證和模型選擇 sklearn：使用交叉驗證進行遞歸特征消除的好處是什么？ R mlr-包裝器功能選擇+超參數調整，而沒有嵌套嵌套的交叉驗證？交叉驗證是分類中的特征選擇 LDA交叉驗證和變量選擇 model 選擇是否使用交叉驗證？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM