簡體   English   中英

QuantileTransformer 和 PowerTransformer 的區別

[英]Differences between QuantileTransformer and PowerTransformer

在 sklearn 中,QuantileTransformer 的文檔說

該方法將特征轉換為遵循均勻或正態分布

PowerTransformer 的文件說,

應用冪變換特征使數據更像高斯

似乎它們都可以將特征轉換為高斯/正態分布。 在這方面以及何時使用哪個方面有什么區別?

他們使用的術語令人困惑,因為高斯分布和正態分布實際上是相同的。

QuantileTransformer 和 PowerTransformer 都是非線性的。

要根據https://scikit-learn.org回答您關於究竟有什么區別的問題:

“QuantileTransformer 提供非線性變換,其中邊緣異常值和內點之間的距離縮小。PowerTransformer 提供非線性變換,其中數據映射到正態分布以穩定方差並最小化偏度。”

來源和更多信息在這里: https://scikit-learn.org/stable/auto_examples/preprocessing/plot_all_scaling.html#:~:text=QuantileTransformer%20provides%20non%2Dlinear%20transformations,stabilize%20variance%20and%20minimize%20skewness .

主要區別在於PowerTransformer()是參數化的,而QuantileTransformer()是非參數化的。 Box-Cox 或 Yeo-Johnson 將使您的數據看起來更“正常”(即不那么偏斜且更居中),但它通常與完美的高斯相距甚遠。 QuantileTransformer(output_distribution='normal')結果通常看起來更接近高斯分布,但代價是線性關系扭曲得更多。 我相信沒有經驗法則可以決定在特定情況下哪個會更好,但值得注意的是,在執行GridSearchCV()時,您可以在管道中使用 select 最佳縮放器。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM