Python中的幂律分布拟合

Question

我正在使用不同的 python 来拟合数据集上的密度函数。 该数据集由从 1 秒开始的正时间值组成。

我测试了不同密度函数scipy.statistics和powerlaw库使用，以及我自己的功能scipy.optimize的功能curve_fit()

到目前为止，我在拟合以下“修改后的”幂律函数时获得了最佳结果：

def funct(x, alpha, x0):
    return((x+x0)**(-alpha))

我的代码如下：

bins = range(1,int(s_distrib.max())+2,1)
y_data, x_data = np.histogram(s_distrib, bins=bins, density=True)
x_data = x_data[:-1]

param_bounds=([0,-np.inf],[np.inf,np.inf])
fit = opt.curve_fit(funct,
                    x_data,
                    y_data,
                    bounds=param_bounds) # you can pass guess for the parameters/errors
alpha,x0 = fit[0]
print(fit[0])

C = 1/integrate.quad(lambda t: funct(t,alpha,x0),1,np.inf)[0]

# Calculate fitted PDF and error with fit in distribution
pdf = [C*funct(x,alpha,x0) for x in x_data]
sse = np.sum(np.power(y_data - pdf, 2.0))
print(sse)

fig, ax = plt.subplots(figsize=(6,4))
ax.loglog(x_data, y_data, basex=10, basey=10,linestyle='None',  marker='.')
ax.loglog(x_data, pdf, basex=10, basey=10,linestyle='None',  marker='.')

拟合为 x0 返回 8.48 的值，为 alpha 返回 1.40 的值。 在 loglog 图中，数据和拟合图如下所示：

我的第一个问题是技术问题。 为什么我得到以下警告和错误opt.curve_fit在不断变化的（X + X0）到（X-X0）时， funct的功能？ 由于我对 x0 的界限是 (-inf, +inf)，我期待拟合返回 -8.48。

/anaconda3/lib/python3.7/site-packages/ipykernel_launcher.py:3: 运行时警告：在倒数中遇到除以零这与 ipykernel 包分开，因此我们可以避免进行导入，直到 ValueError: Residuals are not in the initial观点。

我的其他问题是理论上的。 (x+x0)^(-alpha) 是标准分布吗？ x0值代表什么，物理上怎么解释这个8.48s的值？ 据我了解，这意味着我的分布对应于幂律分布？ 我可以认为 x0 对应于将数据拟合到幂律时通常需要的 xmin 值吗？
关于这个 xmin 值，我理解在拟合过程中只考虑大于这个阈值的数据来表征分布的尾部是有意义的。 但是，我想知道用 xmin 之后的幂律和 xmin 之前的其他分布来表征完整数据的标准方法是什么。

这是很多问题，因为我对这个主题非常陌生，任何评论和回答，即使是部分的，都将不胜感激！

Answer 1

(x+x0)^(-alpha) 是标准分布吗？

要回答您的第二个问题，是的，它是标准发行版，称为Zipf 发行版。 它是在Python / NumPy的实施，以及。

x0 值代表什么

这是移位参数。 标准参数之上的任何分布（如 Zipf 中的功率参数）都可能具有位移和比例参数，这基本上表示您的 X 值是用不同的单位以不同的原点测量的。

关于这个 xmin 值，我理解在拟合过程中只考虑大于这个阈值的数据来表征分布的尾部是有意义的。

这就是 Zipf 定律的定义方式，从 0 到无穷大。 改变它意味着你的起源会有所不同

Python中的幂律分布拟合

问题描述

1 个解决方案

解决方案1
1 2020-04-02 15:54:56

Python中的幂律分布拟合

问题描述

1 个解决方案

解决方案1 1 2020-04-02 15:54:56

解决方案1
1 2020-04-02 15:54:56