簡體   English   中英

使用回歸數據模型預測價格

[英]Predicting price using regression data model

我建立了回歸數據模型來預測幾個自變量的房價。 我得到了帶系數的回歸方程。 在拆分數據集之前,我使用 StandardScaler() 來縮放我的變量。 現在我想在給定自變量的新值時使用我的回歸模型預測房價,我可以直接使用自變量的值並計算價格嗎? 或者在包含自變量的值之前,我應該通過 StandardScaler() 方法傳遞值嗎??

是的,您需要預處理新值。 如果您對訓練數據進行了縮放並將模型擬合到該縮放后的數據中,那么輸入到模型中的任何新數據也應經過等效的預處理。 這是標准做法,因為它確保始終為模型提供一致形式的數據集作為輸入。 需要注意的是,您應該使用transform而不是fit_transform

該過程可能如下所示:

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
new_data = scaler.transform(new_data)

在您可能感興趣的另一個線程上有關於此主題的詳細文章。

要回答您的問題,是的,您還必須處理您的測試輸入,但請考慮以下解釋。

StandardScaler() 通過去除均值和縮放到單位方差來標准化特征

如果在整個數據集上擬合縮放器然后拆分,縮放器將在計算均值和方差時考慮所有值。

理想情況下,不應使用訓練數據對測試集進行預處理。 這將確保不會“偷看”。 訓練數據應該單獨預處理,一旦創建模型,我們就可以將用於訓練集的相同預處理參數應用到測試集上,就好像測試集以前不存在一樣。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM