繁体   English   中英

朴素贝叶斯分类器中的 Python 偏度和峰度

[英]Python Skewness and Kurtosis in Naive Bayes classifier

我正在用 Python 创建一个朴素贝叶斯分类器,它将能够根据一天的一些天气数据猜测它是哪一个月。

目前,均值和标准差用于对月份进行分类,但我认为添加偏度和峰度可能有助于提高准确性。

我目前正在使用 scipy.stats.norm.cdf 来计算机会,但我似乎无法在 Python 中找到任何考虑偏度和峰度的 cdf 函数。

我觉得我可能没有正确理解偏度和峰度。 偏度和峰度对 cdf 函数有影响,因此我希望将它们作为参数给出。

我对偏度、峰度和 cdf 函数的理解有什么根本性的错误吗? 如果没有,那么我在哪里可以找到将所有这些参数都考虑在内的 Python 中 cdf 函数的实现?

您使用的正态分布 (scipy.stats.norm) 并且通常用于建模朴素贝叶斯中的一维条件分布,它仅由两个参数明确定义 - 它的meanstd 指定偏度/峰度没有意义,因为它们对于您的分布是恒定的(特别是峰度为 3)。

您正在考虑的可能是 Pearson 分布,用于拟合更多时刻(均值、标准差、偏度和峰度)。

http://docs.scipy.org/doc/scipy-0.15.1/reference/generated/scipy.stats.pearson3.html

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM