`python`中的加权高斯核密度估计

Question

更新： scipy.stats.gaussian_kde现在支持加权样本。 有关详细信息，请参阅此处和此处。

目前无法使用scipy.stats.gaussian_kde来估计基于加权样本的随机变量的密度。 有哪些方法可以根据加权样本估计连续随机变量的密度？

Answer 1

sklearn.neighbors.KernelDensity和statsmodels.nonparametric似乎都不支持加权样本。 我修改了scipy.stats.gaussian_kde以允许异构采样权重，并认为结果可能对其他人有用。 一个例子如下所示。

可以在此处找到ipython笔记本： http : ipython

实施细则

加权算术平均值为

加权算术平均值

无偏数据协方差矩阵由下式给出 无偏协方差矩阵

可以像scipy一样通过scott或silverman规则选择带宽。 但是，用于计算带宽的样本数是Kish 对有效样本大小的近似值。

Answer 2

对于单变量分布，您可以使用KDEUnivariate的KDEUnivariate 。 它没有很好的文档记录，但fit方法接受weights参数。 那么你不能使用FFT。 下面是一个例子：

import matplotlib.pyplot as plt
from statsmodels.nonparametric.kde import KDEUnivariate

kde1= KDEUnivariate(np.array([10.,10.,10.,5.]))
kde1.fit(bw=0.5)
plt.plot(kde1.support, [kde1.evaluate(xi) for xi in kde1.support],'x-')

kde1= KDEUnivariate(np.array([10.,5.]))
kde1.fit(weights=np.array([3.,1.]), 
         bw=0.5,
         fft=False)
plt.plot(kde1.support, [kde1.evaluate(xi) for xi in kde1.support], 'o-')

产生这个数字：

Answer 3

查看 Python 的 PyQT-Fit 和统计数据包。 他们似乎有加权观察的核密度估计。

`python`中的加权高斯核密度估计

问题描述

3 个解决方案

解决方案1
25 已采纳 2014-12-23 16:06:37

实施细则

解决方案2
2 2018-08-30 12:18:45

解决方案3
1 2015-06-03 16:23:44

`python`中的加权高斯核密度估计

问题描述

3 个解决方案

解决方案1 25 已采纳 2014-12-23 16:06:37

实施细则

解决方案2 2 2018-08-30 12:18:45

解决方案3 1 2015-06-03 16:23:44

解决方案1
25 已采纳 2014-12-23 16:06:37

解决方案2
2 2018-08-30 12:18:45

解决方案3
1 2015-06-03 16:23:44