簡體   English   中英

盡管所有正值,線性回歸中的負置信區間

[英]Negative confidence interval in linear regression despite all positive values

即使所有數據點都是正數,我也得到了線性回歸圖的負置信區間。 為什么會這樣? 我相信這個負置信區間也會影響我的 R^2 分數嗎?

使用的代碼是:

    sns.regplot(x = 'Consumer Confidence Index_1', y = 'Sales (ALV
sources)', data = df_mx2)

plt.show()

看這里的圖

線性回歸的基本假設之一是數據在直線上呈正態分布。 在您的情況下,您的右側和左側都有數據,中間有很大的差距。 因此,您應該仔細檢查線性回歸是否適合您的分析。

話雖如此,請放心,負置信區間不會影響您的 R² 值。

負置信區間的原因與 x<42 的數據稀疏有關。 如果刪除右側的三個點,則回歸將在 x=42 附近與 x 軸相交具有正斜率。 如果這條線被擴展到 x=30 左右,那將是非常消極的。 因此,數據表明要達到您設置的置信閾值,置信區間必須非常大,以包含可能與更陡峭的回歸線對齊的數據。

這可以解釋為數據在 x=42 以下提供的預測能力非常少。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM