繁体   English   中英

如何在 Python 中计算平方和?

[英]How to calculate sums of squares in Python?

首先,公式TSS = ESS + RSS总是正确的吗? 即使是指数模型? 如果是这样,我只是不明白我错在哪里。

我有 2 个 x 和 y 值数组,其中 y 取决于 x。

x = np.array([1.5, 2.1, 2.4, 2.7, 3.2, 3.4, 3.6, 3.7, 4.0, 4.5, 5.1, 5.6])
y = np.array([0.6, 1.2, 1.3, 1.4, 1.45, 1.5, 1.6, 1.8, 1.9, 1.95, 2.1, 2.2])

我有一个函数可以确定系数 a 和 b 并返回一个线性回归方程(如果需要,也可以只返回 a 和 b)

def Linear(x, y, getAB = False):
    AVG_X = np.average(x)
    AVG_Y = np.average(y)
    DISP_X = np.var(x)
    DISP_Y = np.var(y)
    STD_X = np.std(x)
    STD_Y = np.std(y)

    AVG_prod = np.average(x*y)
    cov = AVG_prod - (AVG_X*AVG_Y)

    b = cov/DISP_X
    a = AVG_Y - b*AVG_X

    if getAB:
        return a, b

    return lambda X: a + b*X

我有一个确定系数 a 和 b 并返回指数回归方程的函数

def Exponential(x, y, getAB = False):
    LOG_Y_array = [math.log(value) for value in y]

    A, B = Linear(x, LOG_Y_array, getAB = True)

    a = math.exp(A)
    b = math.exp(B)

    if getAB:
        return a, b

    return lambda X: a * (b**X)

我创建了基于指数模型的计算 y 值数组

Exponential_Prediction = Exponential(x, y)
Exponential_Prediction_y = [Exponential_Prediction(value) for value in x]

最后,这就是我计算 TSS、ESS 和 RSS 的方式

TSS = np.sum((y - np.average(y))**2)
ESS_Exp = np.sum((Exponential_Prediction_y - np.average(y))**2)
RSS_Exp = np.sum((y-Exponential_Prediction_y)**2)

这一切都非常清楚,除了这个的输出

print(str(TSS) + " = " + str(ESS_Exp) + " + " + str(RSS_Exp))

是 2.18166666667 = 2.75523753042 + 0.432362713806

我不明白 ESS 怎么可能超过 TSS

当您使用线性回归时,您会遗漏一个为零的项,因为您不是,您必须添加它。 在文斯评论的链接中,您可以看到 TSS = ESS + RSS + 2*sum((y - yhat)*(yhat - ybar))。

您需要包含该额外术语才能将其加起来:

extra_term = 2 * np.sum((y - Exponential_Prediction_y) * (Exponential_Prediction_y - y.mean())) 
print(str(TSS) + " = " + str(ESS_Exp) + " + " + str(RSS_Exp) + " + " + str(extra_term))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM