簡體   English   中英

sklearn的多項式特征和多項式回歸

[英]Polynomial Features and polynomial regression in sklearn

我有兩個問題:

  1. 多項式特征上的fit_transform的輸出是什么(數字表示什么)? 如果我錯了,請糾正我,但據我所知,此方法適合並將我們的變量轉換為多項式模型(由我們選擇程度)。
    例如:
from sklearn.preprocessing import PolynomialFeatures

poly=PolynomialFeatures(degree=2)

poly.fit_transform(df[[firstColumn,secondColumn]],df[targetColumn])

因此,結果是一個二維多項式,其中df [firstColumn]和df [secondColumn]為變量。

2)在多項式回歸中,為什么我們需要使用fit_tranform? 它背后的邏輯是什么?
例如,

Xpoly=poly.fit_transform(X)

lin=LinearRegression()

lin.fit(Xpoly,y)

sklearn文檔

sklearn.preprocessing.PolynomialFeatures
生成由度小於或等於指定度的特征的所有多項式組合組成的新特征矩陣。 例如,如果輸入樣本是二維且格式為[a,b],則2階多項式特征為[1,a,b,a ^ 2,ab,b ^ 2]。

因此,這完全符合您的想法。

fit_transform(self,X,y = None,** fit_params)
使用可選參數fit_params將轉換器擬合到X和y,並返回X的轉換版本。

在sklearn中, fit()僅計算參數並將其保存為內部對象狀態。 之后,您可以調用其transform()方法以將轉換應用於特定的示例集。

fit_transform()結合了這兩個步驟,用於對訓練集x進行參數的初始擬合,但它也返回轉換后的x'。 在內部,它只對相同的數據先調用fit() ,然后再進行transform()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM