繁体   English   中英

尽管所有正值,线性回归中的负置信区间

[英]Negative confidence interval in linear regression despite all positive values

即使所有数据点都是正数,我也得到了线性回归图的负置信区间。 为什么会这样? 我相信这个负置信区间也会影响我的 R^2 分数吗?

使用的代码是:

    sns.regplot(x = 'Consumer Confidence Index_1', y = 'Sales (ALV
sources)', data = df_mx2)

plt.show()

看这里的图

线性回归的基本假设之一是数据在直线上呈正态分布。 在您的情况下,您的右侧和左侧都有数据,中间有很大的差距。 因此,您应该仔细检查线性回归是否适合您的分析。

话虽如此,请放心,负置信区间不会影响您的 R² 值。

负置信区间的原因与 x<42 的数据稀疏有关。 如果删除右侧的三个点,则回归将在 x=42 附近与 x 轴相交具有正斜率。 如果这条线被扩展到 x=30 左右,那将是非常消极的。 因此,数据表明要达到您设置的置信阈值,置信区间必须非常大,以包含可能与更陡峭的回归线对齐的数据。

这可以解释为数据在 x=42 以下提供的预测能力非常少。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM