簡體 English 中英

使用MinMaxScaler將測試數據縮放為0和1

[英]Scaling test data to 0 and 1 using MinMaxScaler

原文 2015-05-27 05:05:53 4 2 python/ machine-learning/ scikit-learn/ svm

使用sklearn的MinMaxScaler，我按如下所示縮放數據。

min_max_scaler = preprocessing.MinMaxScaler()
X_train_scaled = min_max_scaler.fit_transform(features_train)
X_test_scaled = min_max_scaler.transform(features_test)

但是，在打印X_test_scaled.min（）時，我有一些負值（值不介於0和1之間）。 這是由於以下事實：我的測試數據中的最小值低於適合最小最大縮放器的火車數據。

SVM分類器對0到1值之間的數據進行標准化處理不會產生多大影響？ 另外，將訓練和測試數據連接到一個矩陣中，執行最小-最大縮放以確保值在0到1之間，然后再次將它們分開，是不明智的做法？

2 個解決方案

如果您可以一次縮放所有數據，那會更好，因為所有數據都由Scaler以邏輯方式管理（都在0到1之間）。 但是對於SVM算法，縮放器將擴展縮放比例，因此必須沒有任何區別。 即使是負數，仍然存在相同的差異。

在文檔中，我們可以看到存在負值，因此我認為它不會對結果產生影響

對於這種縮放，實際上它並不重要，但是通常您不應該使用測試數據來估計預處理的任何參數。 這可能會使您的結果嚴重偏向更復雜的預處理步驟。

確實沒有理由要在此處連接數據，SVM會處理它。 如果您使用的模型需要正值，而您的測試數據不是正數，則可以考慮使用MinMaxScaler以外的其他策略。

如何使用 MinMaxScaler sklearn 規范化訓練和測試數據

[英]How to normalize the Train and Test data using MinMaxScaler sklearn

對某些數據使用 MinMaxScaler 時出錯

[英]Error when using MinMaxScaler with some data

使用MinMaxScaler轉換測試集時會發生什么

[英]What happens when you transform the test set using MinMaxScaler

當 model 使用 sklearn2pmml 轉換為 PMML 時，sklearn.preprocessing._data.MinMaxScaler 不是受支持的 Transformer

[英]sklearn.preprocessing._data.MinMaxScaler is not a supported Transformer When the model is converted to PMML using sklearn2pmml

MinMaxScaler + 具有數值和分類數據的決策樹分類器

[英]MinMaxScaler + DecisionTree classifier with numerical and categorical data

使用minmaxscaler時如何保留數據幀的索引？

[英]How to keep index of a dataframe while using minmaxscaler?

如何使用 MinMaxScaler 規范化 np.ndarray？

[英]How to normalize np.ndarray using MinMaxScaler?

如何解決使用MinMaxScaler轉換的數據和實際數據之間的順序？

[英]How to fix the ordering between transformed data with MinMaxScaler and actual data?

在 MinMaxScaler 中為多個特征使用相同的最小和最大數據

[英]Use same Min and Max Data for Multiple Features in MinMaxScaler

深度學習：如何使用skLearn縮放預測數據-MinMaxScaler（）

[英]Deep Learning: How to scale predicted data with skLearn - MinMaxScaler()

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何使用 MinMaxScaler sklearn 規范化訓練和測試數據對某些數據使用 MinMaxScaler 時出錯使用MinMaxScaler轉換測試集時會發生什么當 model 使用 sklearn2pmml 轉換為 PMML 時，sklearn.preprocessing._data.MinMaxScaler 不是受支持的 Transformer MinMaxScaler + 具有數值和分類數據的決策樹分類器使用minmaxscaler時如何保留數據幀的索引？如何使用 MinMaxScaler 規范化 np.ndarray？如何解決使用MinMaxScaler轉換的數據和實際數據之間的順序？在 MinMaxScaler 中為多個特征使用相同的最小和最大數據深度學習：如何使用skLearn縮放預測數據-MinMaxScaler（）

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM