簡體 English 中英

將數據集拆分為 5~fold 以進行交叉驗證

[英]Split dataset into 5~fold for cross-validation

原文 2021-11-01 21:25:58 2 1 python/ pandas/ dataframe/ cross-validation/ k-fold

我有一個數據集，我想將其拆分為 5 折（不同），而不是傳統的80-20拆分。

例如：

X = pd.DataFrame({'a': [1, 3, 5, 7, 4, 5, 6, 4, 7, 9],
                  'b': [3, 5, 6, 2, 4, 6, 7, 8, 7, 8],
                  'c': [2, 3, 4, 5, 6, 7, 8, 9, 2, 1]} )
y = [2, 3, 1, 1, 3, 2, 1, 3, 2, 2]

X

    a   b   c
0   1   3   2
1   3   5   3
2   5   6   4
3   7   2   5
4   4   4   6
5   5   6   7
6   6   7   8
7   4   8   9
8   7   7   2
9   9   8   1

所以我有X1,X2,..,X5和相應的y1,y2,..,y5 。

1 個解決方案

使用KFold的sklearn ：

from sklearn.model_selection import KFold

print(list(kf.split(X, y)))

# Output:
[(array([2, 3, 4, 5, 6, 7, 8, 9]), array([0, 1])),
 (array([0, 1, 4, 5, 6, 7, 8, 9]), array([2, 3])),
 (array([0, 1, 2, 3, 6, 7, 8, 9]), array([4, 5])),
 (array([0, 1, 2, 3, 4, 5, 8, 9]), array([6, 7])),
 (array([0, 1, 2, 3, 4, 5, 6, 7]), array([8, 9]))]

如何在回歸神經網絡中使用 k 折交叉驗證而不是 train_test_split

[英]How to use k-fold cross-validation instead of train_test_split for Regression Neural Network

Scikitlearn - 交叉驗證后的評分數據集

[英]Scikitlearn - score dataset after cross-validation

k-fold分層交叉驗證與不平衡類

[英]k-fold stratified cross-validation with imbalanced classes

10折交叉驗證並獲得RMSE

[英]10-fold cross-validation and obtaining RMSE

scikit-learn：為什么這個 2 折交叉驗證圖看起來像 4 折交叉驗證？

[英]scikit-learn: Why does this 2-fold cross-validation figure looks like 4-fold cross-validation?

使用 shuffle=True 的“正常”k 折交叉驗證和重復的 k 折交叉驗證有什么區別？

[英]What is the difference between a “normal” k-fold cross-validation using shuffle=True and a repeated k-fold cross-validation?

對整個數據集進行 K 折交叉驗證

[英]K-Fold Cross Validation on entire Dataset

在 k-Fold 交叉驗證中，是否為 Sklearn 中的每個折疊啟動了一個新模型？

[英]In k-Fold cross-validation, is a new model initiated for each fold in Sklearn?

Keras 中的 validation_split=0.2 是交叉驗證嗎？

[英]Is validation_split=0.2 in Keras a cross-validation?

關於交叉驗證 model 的 MSE 隨着回歸數據集的增加而增加

[英]Regarding increase in MSE of Cross-Validation model with increasing dataset for regression

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在回歸神經網絡中使用 k 折交叉驗證而不是 train_test_split Scikitlearn - 交叉驗證后的評分數據集 k-fold分層交叉驗證與不平衡類 10折交叉驗證並獲得RMSE scikit-learn：為什么這個 2 折交叉驗證圖看起來像 4 折交叉驗證？使用 shuffle=True 的“正常”k 折交叉驗證和重復的 k 折交叉驗證有什么區別？對整個數據集進行 K 折交叉驗證在 k-Fold 交叉驗證中，是否為 Sklearn 中的每個折疊啟動了一個新模型？ Keras 中的 validation_split=0.2 是交叉驗證嗎？關於交叉驗證 model 的 MSE 隨着回歸數據集的增加而增加

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM