繁体   English   中英

Python高斯拟合模拟高斯噪声数据

[英]Python gaussian fit on simulated gaussian noisy data

我需要使用高斯拟合对来自仪器的数据进行插值。 为此我想过使用curve_fit功能从scipy 由于我想先在假数据上测试此功能,然后再在仪器上尝试使用此代码,因此编写了以下代码来生成嘈杂的高斯数据并使之适合:

from scipy.optimize import curve_fit
import numpy
import pylab

# Create a gaussian function

def gaussian(x, a, b, c):
    val = a * numpy.exp(-(x - b)**2 / (2*c**2))
    return val

# Generate fake data.
zMinEntry = 80.0*1E-06
zMaxEntry = 180.0*1E-06
zStepEntry = 0.2*1E-06

x = numpy.arange(zMinEntry, 
                 zMaxEntry, 
                 zStepEntry, 
                 dtype = numpy.float64)    

n = len(x)                 

meanY = zMinEntry + (zMaxEntry - zMinEntry)/2
sigmaY = 10.0E-06

a = 1.0/(sigmaY*numpy.sqrt(2*numpy.pi))
y = gaussian(x, a, meanY, sigmaY) + a*0.1*numpy.random.normal(0, 1, size=len(x))


# Fit
popt, pcov = curve_fit(gaussian, x, y)

# Print results
print("Scale =  %.3f +/- %.3f" % (popt[0], numpy.sqrt(pcov[0, 0])))
print("Offset = %.3f +/- %.3f" % (popt[1], numpy.sqrt(pcov[1, 1])))
print("Sigma =  %.3f +/- %.3f" % (popt[2], numpy.sqrt(pcov[2, 2])))


pylab.plot(x, y, 'ro')
pylab.plot(x, gaussian(x, popt[0], popt[1], popt[2]))
pylab.grid(True)
pylab.show()

不幸的是,这不能正常工作,代码输出如下:

Scale =  6174.816 +/- 7114424813.672
Offset = 429.319 +/- 3919751917.830
Sigma =  1602.869 +/- 17923909301.176

绘制的结果是(蓝色是拟合函数,红色点是嘈杂的输入数据):

在此处输入图片说明

我也尝试着看这个答案,但不知道我的问题在哪里。 我在这里想念什么吗? 还是我以错误的方式使用curve_fit函数? 提前致谢!

就规模问题而言,我同意奥拉夫的观点。 最佳参数相差许多数量级。 但是,缩放用于生成玩具数据的参数似乎无法解决实际应用中的问题。 curve_fit使用lestsq ,它在数值上近似于Jacobian值,在该值上,由于比例不同而出现数字问题(尝试在curve_fit使用full_output关键字)。

以我的经验,通常最好使用不依赖于近似导数而仅使用函数值的fmin 现在,您必须编写自己的最小二乘法以进行优化。

起始值仍然很重要。 你的情况,你可以通过采取最大振幅做出足够好的猜测a和相应的x值bc

在代码中,它看起来像这样:

from scipy.optimize import curve_fit,fmin
import numpy
import pylab

# Create a gaussian function

def gaussian(x, a, b, c):
    val = a * numpy.exp(-(x - b)**2 / (2*c**2))
    return val

# Generate fake data.
zMinEntry = 80.0*1E-06
zMaxEntry = 180.0*1E-06
zStepEntry = 0.2*1E-06

x = numpy.arange(zMinEntry, 
                 zMaxEntry, 
                 zStepEntry, 
                 dtype = numpy.float64)    

n = len(x)                 

meanY = zMinEntry + (zMaxEntry - zMinEntry)/2
sigmaY = 10.0E-06

a = 1.0/(sigmaY*numpy.sqrt(2*numpy.pi))
y = gaussian(x, a, meanY, sigmaY) + a*0.1*numpy.random.normal(0, 1, size=len(x))

print a, meanY, sigmaY
# estimate starting values from the data
a = y.max()
b = x[numpy.argmax(a)]
c = b

# define a least squares function to optimize
def minfunc(params):
    return sum((y-gaussian(x,params[0],params[1],params[2]))**2)

# fit
popt = fmin(minfunc,[a,b,c])

# Print results
print("Scale =  %.3f" % (popt[0]))
print("Offset = %.3f" % (popt[1]))
print("Sigma =  %.3f" % (popt[2]))


pylab.plot(x, y, 'ro')
pylab.plot(x, gaussian(x, popt[0], popt[1], popt[2]),lw = 2)
pylab.xlim(x.min(),x.max())
pylab.grid(True)
pylab.show()

在此处输入图片说明

看起来一些数值不稳定性正在渗入优化器。 尝试缩放数据。 带有以下数据:

zMinEntry = 80.0*1E-06 * 1000
zMaxEntry = 180.0*1E-06 * 1000
zStepEntry = 0.2*1E-06 * 1000
sigmaY = 10.0E-06 * 1000

我得到的估计

Scale =  39.697 +/- 0.526
Offset = 0.130 +/- 0.000
Sigma =  -0.010 +/- 0.000

将其与真实值进行比较:

Scale = 39.894228
Offset = 0.13
Sigma = 0.01

sigma的负号当然可以忽略。

这给出了以下情节

在此处输入图片说明

正如我在评论中所说,如果您提供合理的初始猜测,则拟合成功,即像这样调用curve_fit

popt, pcov = curve_fit(gaussian, x, y, [50000,0.00012,0.00002])

图形

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM