繁体   English   中英

在 Python 中使用多个高斯分布拟合数据

[英]Fitting data with multiple Gaussian profiles in Python

我有一些数据(data.txt) ,我正在尝试用 Python 编写代码,以不同的方式将它们与高斯轮廓拟合,以获得和比较每种情况下的峰值分离和曲线下面积:

  1. 具有两个高斯轮廓(考虑顶部的小峰并忽略肩部;红色轮廓)
  2. 具有两个高斯轮廓(忽略顶部的小峰并考虑顶部和肩部的整个单峰;黑色轮廓)
  3. 具有三个高斯轮廓(考虑肩部两个较短的峰;绿色轮廓)

我尝试了几个脚本,但都失败了。

这些图中的配置文件是假的,我添加它们只是为了更好地说明我的意思。

地块

一种方法如下:

  1. 定义要适合数据的函数,即应该在那里的所有组件的总和。 在你的情况下,这是多个高斯。
  2. 为您的参数找到初始猜测。
  3. 使用您喜欢的策略,将您的拟合函数拟合到数据中。

我查看了您的数据,下面是使用 SciPy 的curve_fit方法拟合三个高斯分量和连续偏移的一个非常简单的示例。 剩下的就交给你了这应该允许您找出其他情况。 请注意,初始猜测通常很重要,因此最好以某种方式进行有根据的猜测,以尽可能接近最佳值。

代码

from scipy.optimize import curve_fit

import matplotlib.pyplot as plt
import numpy as np

def gaussian(x, A, x0, sig):
    return A*np.exp(-(x-x0)**2/(2*sig**2))

def multi_gaussian(x, *pars):
    offset = pars[-1]
    g1 = gaussian(x, pars[0], pars[1], pars[2])
    g2 = gaussian(x, pars[3], pars[4], pars[5])
    g3 = gaussian(x, pars[6], pars[7], pars[8])
    return g1 + g2 + g3 + offset

vel, flux = np.loadtxt('data.txt', unpack=True)
# Initial guesses for the parameters to fit:
# 3 amplitudes, means and standard deviations plus a continuum offset.
guess = [4, -50, 10, 4, 50, 10, 7, 0, 50, 1]
popt, pcov = curve_fit(multi_gaussian, vel, flux, guess)

plt.figure()
plt.plot(vel, flux, '-', linewidth=4, label='Data')
plt.plot(vel, multi_gaussian(vel, *popt), 'r--', linewidth=2, label='Fit')
plt.legend()
plt.show()

结果

三高斯拟合

scikit-learn 有一个 GaussianMixtureModel 的实现,它可以做到这一点。 有关示例,请参阅用户指南

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM