簡體 English 中英

如何處理不同特征的數據集？

[英]How to deal with dataset of different features?

原文 2023-01-12 01:30:56 0 1 machine-learning/ classification/ mlp

我正在努力在 CEA 分類數據集（二進制分類）上創建 MLP model。 每個樣本包含 4 個不同的特征，例如電阻和其他值，每個都在其自己的范圍內（電阻以百為單位，另一個以微量為單位，等等）。 我還是機器學習的新手，這是第一個真正的 model 構建。 我該如何處理這些數據？ 我已嘗試使用 function 激活 sigmoid 將每個樣本饋送到 neural.network，但我沒有得到准確的結果。 我假設處理這種數據是為了擴展它？ 如果是這樣，有哪些有用的資源可供查看，因為我不太了解何時需要擴展。

1 個解決方案

縮放數據可能是構建機器學習 model 的重要一步，尤其是在使用神經網絡時。 縮放有助於確保數據集中的所有特征都具有相似的比例，這可以使 model 更容易學習。

有幾種不同的方法可以擴展數據，例如規范化和標准化。 規范化是縮放數據以使其具有最小值0和最大值1的過程。 標准化是縮放數據以使其均值為0和標准差為1的過程。

使用 CEA 分類數據集時，嘗試規范化和標准化可能會有所幫助，以了解哪一個更適合您的特定數據集。 您可以使用 scikit-learn 庫的預處理函數，如 MinMaxScaler() 和 StandardScaler() 分別進行規范化和標准化。

此外，嘗試不同的激活函數（例如 ReLU 或 LeakyReLU）可能會有所幫助，看看它們是否會產生更准確的結果。 此外，您可以嘗試在 neural.network 中添加更多層和神經元，看看它是否可以提高性能。

同樣重要的是要記住，特征工程（包括選擇最重要特征的過程）可能比縮放更重要。

如何在二維圖上可視化虹膜數據集的不同特征組合

[英]how to visualize the iris dataset on 2d plots for different combinations of features

測試和訓練數據集具有不同數量的特征

[英]test and train dataset has different number of features

如何處理缺失率超過 80% 的特征

[英]How to deal with features with more than 80% missingness

分類數據集的one-hot編碼：如何處理分類數據中的不同值（較少的數字）

[英]One-hot encoding with categorial dataset: how to deal with different values (less number) in categorical data

如何在數據集中選擇最佳/最差特征進行分類

[英]How to select best/worst features in dataset for classification

如何為更大的數據集運行此函數（9個功能）

[英]How to run this function for a larger dataset(9 features)

如何減少數據集中特定要素的值的大小

[英]How to reduce the size of values in specific features in a dataset

如何處理傳統機器學習中的字符串特征數組？

[英]How to deal with array of string features in traditional machine learning?

如何處理包含離散和連續數據的數據集

[英]How to deal with dataset that contains both discrete and continuous data

如何處理數據集中的匿名變量以獲得更好的預測

[英]how to deal with anonymous variables in your dataset to get better predication

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在二維圖上可視化虹膜數據集的不同特征組合測試和訓練數據集具有不同數量的特征如何處理缺失率超過 80% 的特征分類數據集的one-hot編碼：如何處理分類數據中的不同值（較少的數字）如何在數據集中選擇最佳/最差特征進行分類如何為更大的數據集運行此函數（9個功能）如何減少數據集中特定要素的值的大小如何處理傳統機器學習中的字符串特征數組？如何處理包含離散和連續數據的數據集如何處理數據集中的匿名變量以獲得更好的預測

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM