多變量線性回歸模型的預測截距和系數

Question

我有以下等式：

P = B0 + B1*Var1 + B2*Var2

我有P ， Var1和Var2的值。 我嘗試對此建模，然后計算系數並進行攔截。

以下是我得到的代碼和輸出：

P = [1035.89, 1060.4, 1064, 1075.89, 1078.69, 1074.93, 1090.71, 1080.95, 1086.19,1080.46] # Total power

l = [51.275510204081634, 102.89115646258503, 160.7142857142857, 205.78231292517006, 256.80272108843536, 307.82312925170066, 360.5442176870748, 409.0136054421768, 460.03401360544217, 492.3469387755102]
t = [6.110918671507064, 12.262374116954474, 19.153625686813186, 24.524748233908948, 30.60526432496075, 36.685780416012555, 42.96898037676609, 48.7454706632653, 54.82598675431711, 58.67698027864992]


X = []
for index in range(0,len(P)):
    row = []
    row.append(t[index])
    row.append(l[index])
    X.append(row)

print "Using statsmodels"
import statsmodels.api as sm

X = sm.add_constant(X)
est = sm.OLS(P, X).fit()

print est.params[0]
print est.params[1]
print est.params[2]

我得到的結果是：

Using statsmodels
1048.32518503
0.0102496334198
0.0860026475829

這個對嗎？ est.params[0]是否引用方程式的B0 ？ 我進行實驗時得到的B0在600-650范圍內嗎？

數據是否會由於數據錯誤而失配？

Answer 1

我不熟悉statsmodels ，但是這是一個使用curve_fit的實現（請參見下面的代碼）。 我認為模型預測與實驗結果不匹配的原因是我認為模型（ B0 + B1*Var1 + B2*Var2 ）不能很好地描述數據（指數/對數/平方數可能會更好））。 在接下來的圖中，我顯示原始數據， curve_fit （下面的代碼）獲得的擬合以及使用您的參數的擬合。

在此處輸入圖片說明

如您所見，兩個擬合函數給出的結果相同，但是，我認為您的數據應該由另一個函數建模。 如果有時間，我會尋找更適合您數據的功能。

from scipy.optimize import curve_fit
import numpy as np 
import matplotlib.pyplot as plt

P = [1035.89, 1060.4, 1064, 1075.89, 1078.69, 1074.93, 1090.71, 1080.95, 1086.19,1080.46] # Total power
l = [51.275510204081634, 102.89115646258503, 160.7142857142857, 205.78231292517006, 256.80272108843536, 307.82312925170066, 360.5442176870748, 409.0136054421768, 460.03401360544217, 492.3469387755102]
t = [6.110918671507064, 12.262374116954474, 19.153625686813186, 24.524748233908948, 30.60526432496075, 36.685780416012555, 42.96898037676609, 48.7454706632653, 54.82598675431711, 58.67698027864992]

# your model
def func(x, b0, b1, b2):

    var1, var2 = x

    return b0 + np.dot(b1, var1) + np.dot(b2, var2)

# Curve fit
coeff, _ = curve_fit(func, (l, t), P)
b0, b1, b2 = coeff[0], coeff[1], coeff[2]
print b0, b1, b2

# plot the data
xval = range(1 ,len(P)+1)
plt.scatter(xval, P, s=30, marker = "v", label='P')
plt.scatter(xval, func((l,t), *coeff), s=30, marker = "v", color="red", label='curvefit')
plt.legend(loc='upper left')
plt.figure()
plt.scatter(xval, P, s=30, marker = "v", label='P')
plt.scatter(xval, func((l, t), 1048.32518503, 0.0860026475829, 0.0102496334198 ), s=30, marker = "v",color="black",label='your parameter')
plt.legend(loc='upper left')
plt.show()
print "residuals curve_fit:",((P - func((l,t), *coeff))**2).sum()
print "residuals stats:",((P - func((l,t), 1048.32518503,0.086002647582,0.0102496334198))**2).sum()

多變量線性回歸模型的預測截距和系數

問題描述

1 個解決方案

解決方案1
0 已采納 2015-06-25 20:08:42

多變量線性回歸模型的預測截距和系數

問題描述

1 個解決方案

解決方案1 0 已采納 2015-06-25 20:08:42

解決方案1
0 已采納 2015-06-25 20:08:42