使用sklearn擬合線性回歸后如何獲得殘差的方差

Question

我是 Python 的菜鳥。 我使用 sklearn 來擬合線性回歸：

lm = LinearRegression()
lm.fit(x, y)

如何獲得殘差的方差？

Answer 1

讓我們定義

y_true = np.array([3, -0.5, 2, 7])
y_pred = np.array([2.5, 0.0, 2, 8])

平均絕對誤差可以定義為

np.mean(np.abs(y_true - y_pred)) # 0.5 same as sklearn.metrics.mean_absolute_error

絕對誤差的方差為

np.var(np.abs(y_true - y_pred)) # 0.125

誤差的方差是

np.var((y_true - y_pred)) # 0.3125

現在如何用scikit-learn實現它？

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
# X and target data and train test split
boston = datasets.load_boston()
X, y = boston.data, boston.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
# initialize and fit to your train data and predict on test data
clf = LinearRegression()
clf.fit(X_train, y_train)
preds = clf.predict(X_test)
# evaluate
mean_absolute_error(y_test, preds) == np.mean(np.abs(y_test - preds))
# get the variance of (absolute) residuals
np.var(np.abs(y_test - preds))
np.var((y_test - preds))

使用sklearn擬合線性回歸后如何獲得殘差的方差

問題描述

1 個解決方案

解決方案1
1 2018-10-24 14:43:41

使用sklearn擬合線性回歸后如何獲得殘差的方差

問題描述

1 個解決方案

解決方案1 1 2018-10-24 14:43:41

解決方案1
1 2018-10-24 14:43:41