簡體 English 中英

如何在機器學習模型中使用train.csv，test.csv和ground_truth.csv？（交叉驗證/ python）

[英]How to use a train.csv , test.csv and ground_truth.csv in a machine learning model? (cross validation/ python)

原文 2016-10-10 16:35:46 6 1 python/ numpy/ machine-learning/ scipy/ cross-validation

到目前為止，我只有一個數據集（df.csv）。 到目前為止，對於正常回歸模型，我使用20％的驗證大小和.train_test_split 。

array = df.values
X = array[:,0:26]
Y = array[:,26]
validation_size = 0.20
seed = 7
X_train, X_validation, Y_train, Y_validation =
   cross_validation.train_test_split(X, Y,
   test_size=validation_size, random_state=seed)
num_folds = 10
num_instances = len(X_train)
seed = 7
scoring = 'mean_squared_error'

當我有三個單獨的數據集（train.csv / test.csv / ground_truth.csv）時，該如何處理？ 當然，首先我使用train.csv，然后使用test.csv，最后使用ground_truth。 但是如何在模型中實現這些不同的數據集？

1 個解決方案

當執行交叉驗證時，訓練和測試數據本質上是相同的數據集，為了防止過度擬合，它們以不同的方式進行拆分。 折數表示將組合拆分的不同方式。

例如，五折交叉驗證將訓練集分成5個部分，每次將其中4個用於訓練而將1個用於測試。 因此，根據您的情況，您可以選擇以下選項：

可以只對訓練集執行交叉驗證，然后與測試集和地面真實性進行核對（擬合僅在訓練集上完成，因此，如果正確正確地進行了測試，則地面真實性應與之相似）或將訓練與測試相結合以獲得更大且可能更具代表性的數據集，然后檢查地面真實情況。

泰坦尼克號機器學習train.csv中處理空數據點

[英]Dealing with empty data points in Titanic Machine Learning train.csv

為 10 折交叉驗證實驗創建訓練/測試 CSV 文件

[英]Creating train/test CSV files for 10 fold cross validation experiment

測試和訓練 CSV 文件 python

[英]test and train CSV file python

適用於機器學習算法的Python CSV流

[英]Python csv stream for machine learning algorithms

FileNotFoundError: [Errno 2] No such file or directory: 'Test.csv' in VS Code

[英]FileNotFoundError: [Errno 2] No such file or directory: 'Test.csv' in VS Code

如何通過輸入CSV文件訓練sklearn python中的SVM模型？

[英]How to train SVM model in sklearn python by input CSV file?

即使文件存在，文件 b'train.csv' 也不存在

[英]File b'train.csv' does not exist even though file exist

使用CSV文件在TensorFlow中進行訓練和測試

[英]Train and test in TensorFlow with CSV files

在 python 張量中導入 CSV 數據以進行機器學習的最佳方法？

[英]Best way to import CSV data in a python tensor for machine learning?

如何將逗號分隔值 TXT 轉換為用於機器學習的 CSV

[英]How to turn a comma seperated value TXT into a CSV for machine learning

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 泰坦尼克號機器學習train.csv中處理空數據點為 10 折交叉驗證實驗創建訓練/測試 CSV 文件測試和訓練 CSV 文件 python 適用於機器學習算法的Python CSV流 FileNotFoundError: [Errno 2] No such file or directory: 'Test.csv' in VS Code 如何通過輸入CSV文件訓練sklearn python中的SVM模型？即使文件存在，文件 b'train.csv' 也不存在使用CSV文件在TensorFlow中進行訓練和測試在 python 張量中導入 CSV 數據以進行機器學習的最佳方法？如何將逗號分隔值 TXT 轉換為用於機器學習的 CSV

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM