簡體   English   中英

線性回歸縮放功能

[英]Linear Regression Scaling Features

我想做一個線性回歸。

我的特點是這樣的:

Marketcap       EBIT Margin   Price to Book Ratio   EPS Growth

5.589918e+08    23.05            8.71                 7.16
5.572475e+08    65.00            9.68              - 18.44
8.639290e+09     7.8            12.74              - 55.00

在進行線性回歸時,我確實必須縮放特征,尤其是當它們具有像 Marketcap 和其他特征這樣不同的比例時,對嗎?

EPS增長的負值是什么? 在此示例中執行特征縮放的最佳方法是什么?

文檔

通過去除均值和縮放到單位方差來標准化特征

這意味着,給定輸入 x,將其轉換為 (x-mean)/std(其中所有維度和操作都已明確定義)。

因此,即使您的輸入值都是正值,去除均值也會使其中一些為負值:

>>> x = np.array([3,5,7])
>>> np.mean(x)
5.0
>>> x - np.mean(x)
array([-2.,  0.,  2.])

更多細節:

http://yann.lecun.com/exdb/publis/pdf/lecun-98b.pdf (第 4.3 節) http://scikit-learn.org/stable/modules/preprocessing.html#standardization-or-mean-去除和方差縮放http://www.faqs.org/faqs/ai-faq/neural-nets/part2/section-16.html

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM