繁体   English   中英

QuantileTransformer 和 PowerTransformer 的区别

[英]Differences between QuantileTransformer and PowerTransformer

在 sklearn 中,QuantileTransformer 的文档说

该方法将特征转换为遵循均匀或正态分布

PowerTransformer 的文件说,

应用幂变换特征使数据更像高斯

似乎它们都可以将特征转换为高斯/正态分布。 在这方面以及何时使用哪个方面有什么区别?

他们使用的术语令人困惑,因为高斯分布和正态分布实际上是相同的。

QuantileTransformer 和 PowerTransformer 都是非线性的。

要根据https://scikit-learn.org回答您关于究竟有什么区别的问题:

“QuantileTransformer 提供非线性变换,其中边缘异常值和内点之间的距离缩小。PowerTransformer 提供非线性变换,其中数据映射到正态分布以稳定方差并最小化偏度。”

来源和更多信息在这里: https://scikit-learn.org/stable/auto_examples/preprocessing/plot_all_scaling.html#:~:text=QuantileTransformer%20provides%20non%2Dlinear%20transformations,stabilize%20variance%20and%20minimize%20skewness .

主要区别在于PowerTransformer()是参数化的,而QuantileTransformer()是非参数化的。 Box-Cox 或 Yeo-Johnson 将使您的数据看起来更“正常”(即不那么偏斜且更居中),但它通常与完美的高斯相距甚远。 QuantileTransformer(output_distribution='normal')结果通常看起来更接近高斯分布,但代价是线性关系扭曲得更多。 我相信没有经验法则可以决定在特定情况下哪个会更好,但值得注意的是,在执行GridSearchCV()时,您可以在管道中使用 select 最佳缩放器。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM