[英]Fitting data with an exponential law
我想用指數 function 擬合一些數據。 我使用scipy.optimize.curve_fit
因為我已經將它用於其他擬合。 這一次,有一個問題,我不知道出了什么問題。
這是繪制時數據的樣子: data.png
如您所見,它似乎遵循指數定律。
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit
data = np.array([
0., 1.93468444, 3.69735865, 5.38185988, 6.02549022,
6.69199075, 7.72316694, 8.08913061, 8.84570241, 8.69711608,
8.80038144, 9.78951087, 9.68486674, 10.06175145, 10.44039495,
10.0481156 , 9.76656204, 9.88581457, 9.81805445, 10.42432252,
10.41102239, 11.2911395 , 9.64866184, 9.98072231, 10.83644694,
10.24748571, 10.81333209, 10.75949899, 10.90367328, 10.42446764,
10.51441017, 10.73047737, 10.8159758 , 10.51013538, 10.02862504,
9.76352112, 10.64829309, 10.6293347 , 10.67752596, 10.34801542,
10.53158576, 10.92883362, 10.67002314, 10.37015825, 10.74876349,
10.12821343, 10.8974205 , 10.1591103 , 10.588377 , 11.92134556,
10.309095 , 11.1174362 , 10.72654524, 10.60890374, 10.37456491,
10.05935346, 11.21295863, 11.09013951, 10.60862773, 11.2558922 ,
11.24660234, 10.35981557, 10.81284365, 10.96113067, 10.22716439,
9.8394873 , 10.01892084, 10.38237311, 10.04920671, 10.87782442,
10.42438756, 10.05614503, 10.5446946 , 9.99974368, 10.76930547,
10.22164072, 10.36942999, 10.89888302, 10.47035428, 10.58157374,
11.12615892, 11.30866718, 10.33215937, 10.46723351, 10.54072701,
11.45027197, 10.45895588, 10.34176601, 10.78405493, 10.43964778,
10.34047484, 10.25099046, 11.05847515, 10.27408195, 10.27529163,
10.16568845, 10.86451738, 10.73205291, 10.73300649, 10.49463959,
10.03729782
])
t = np.linspace(0, 100, len(data)) #time array
def expo(x, a, b, c): #exponential function for fitting
return a * np.exp(b * x) + c
fig1, ax1 = plt.subplots()
ax1.plot(t, data, ".", label="data")
coefs = curve_fit(expo, t, data)[0] # fitting
ax1.plot(t, expo(t, coefs[0], coefs[1], coefs[2]), "-", label="fit")
ax1.legend()
plt.show()
問題是 curve_fit() 返回非常大或非常小的系數 a,b 和 c 而它應該返回更像a = -10.5
, b = -0.2
, c = 10.5
擬合過程通過找到損失 function 的局部最小值來工作。 如果問題不受約束,則可能有多個這樣的局部最小值,每個最小值都給出不同的參數值,並且您可能會得到與您期望的不同的值。
如果您猜測參數應該是什么,您可以提供它來縮小搜索范圍:
# with an initial guess for values of a, b, c
coefs = curve_fit(expo, t, data, p0=[-10, -1, 10])[0]
它產生的系數是:
array([-10.48815244, -0.2091102 , 10.56699883])
或者,您可以為參數指定鍵:
# with lower and upper bounds for a, b, c
coefs = curve_fit(expo, t, data, bounds=([-20, -2, 0], [-10, 2, 20]))[0]
這給出了與上述相同的結果。
可能在您的軟件中實現了非線性回歸算法。
開始迭代過程需要參數的“猜測”初始值。 如果用戶沒有提供初始值,則軟件會評估一些初始值。 這通常是失敗的原因,因為計算的初始值可能與正確值相差太遠。
使用不需要初始值的線性回歸方法可以找到一些好的初始值。 請參閱下面的微積分。
結果是:
如果根據某些指定的擬合標准,上述結果的准確性不夠,則需要進行非線性回歸。 在這種情況下,參數 $a,b,c$ 的上述值可以用作初始值來啟動迭代演算。
注意:如上所示線性化非線性回歸的方法的原理在: https://fr.scribd.com/doc/14674814/Regressions-et-equations-integrales
這是我嘗試過的,在 np.exp 中使用了負 b
def expo(x,a,b,c):
return a*np.exp(-b*x) + c
>>>[-10.4881516 0.20911016 10.5669989 ]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.