`python`中的加權高斯核密度估計

Question

更新： scipy.stats.gaussian_kde現在支持加權樣本。 有關詳細信息，請參閱此處和此處。

目前無法使用scipy.stats.gaussian_kde來估計基於加權樣本的隨機變量的密度。 有哪些方法可以根據加權樣本估計連續隨機變量的密度？

Answer 1

sklearn.neighbors.KernelDensity和statsmodels.nonparametric似乎都不支持加權樣本。 我修改了scipy.stats.gaussian_kde以允許異構采樣權重，並認為結果可能對其他人有用。 一個例子如下所示。

可以在此處找到ipython筆記本： http : ipython

實施細則

加權算術平均值為

加權算術平均值

無偏數據協方差矩陣由下式給出 無偏協方差矩陣

可以像scipy一樣通過scott或silverman規則選擇帶寬。 但是，用於計算帶寬的樣本數是Kish 對有效樣本大小的近似值。

Answer 2

對於單變量分布，您可以使用KDEUnivariate的KDEUnivariate 。 它沒有很好的文檔記錄，但fit方法接受weights參數。 那么你不能使用FFT。 下面是一個例子：

import matplotlib.pyplot as plt
from statsmodels.nonparametric.kde import KDEUnivariate

kde1= KDEUnivariate(np.array([10.,10.,10.,5.]))
kde1.fit(bw=0.5)
plt.plot(kde1.support, [kde1.evaluate(xi) for xi in kde1.support],'x-')

kde1= KDEUnivariate(np.array([10.,5.]))
kde1.fit(weights=np.array([3.,1.]), 
         bw=0.5,
         fft=False)
plt.plot(kde1.support, [kde1.evaluate(xi) for xi in kde1.support], 'o-')

產生這個數字：

Answer 3

查看 Python 的 PyQT-Fit 和統計數據包。 他們似乎有加權觀察的核密度估計。

`python`中的加權高斯核密度估計

問題描述

3 個解決方案

解決方案1
25 已采納 2014-12-23 16:06:37

實施細則

解決方案2
2 2018-08-30 12:18:45

解決方案3
1 2015-06-03 16:23:44

`python`中的加權高斯核密度估計

問題描述

3 個解決方案

解決方案1 25 已采納 2014-12-23 16:06:37

實施細則

解決方案2 2 2018-08-30 12:18:45

解決方案3 1 2015-06-03 16:23:44

解決方案1
25 已采納 2014-12-23 16:06:37

解決方案2
2 2018-08-30 12:18:45

解決方案3
1 2015-06-03 16:23:44