簡體   English   中英

什么是線性回歸模型中的 r 平方?

[英]what is r-squared in linear regression models?

我對線性回歸 model 中 r 平方分數的定義有點困惑。 據我所知,R 平方分數表示有多少因變量可以由自變量確定。 然而,在 scikit learn 庫中,我們有一個 r2-score function 計算 r2_score(y_true, y_pred) 之類的 r-squared 分數。 但是這里的兩個參數都是output的值,而且好像沒有涉及到任何獨立變量。 你能幫我理解這是如何計算的嗎?

您詢問了 python 代碼x = r2_score(y_true, y_pred)

注意:

y_pred y_true
y_pred代表“y 變量的預測 y_true代表“y 變量的值”
預測值絕不是原始數據。 通常,預測值是一條最佳擬合線。 y_true是您在實驗、調查或科學研究期間收集的原始數字。

假設您有一個青少年身高的 model 作為年齡的 function。

年齡(出生后的年數) 10年 12年 14年 16年
高度(英寸) 55 60 65 68

AGE定義為出生后的年數(不是受孕后的年數,如在中國)。
此外,我們將年齡四舍五入到最接近的整年。 10.81773歲的兒童被列為10歲。

預測值的一個示例可能是您認為 10 歲的兒童平均身高為 55 英寸。

如果您進行一項研究,測量 1,038 名每個 10 歲兒童的身高,您會發現這些兒童的身高並非都是 55 英寸。

原始數據(測量的兒童身高)被稱為一組真實的 y 值。

統計學家通常通過比較兒童測量身高與預測身高的距離來測量誤差。

例如,10 歲的喬安娜的身高是 52 英寸(四舍五入到最接近的整數英寸)。
我們預測喬安娜的身高是 55 英寸。
真實值和預測值之間存在 3 英寸的差異。

很多時候,統計學家需要一個數據集的數字,而不是 1,038 個不同的數字。

您可以做的一件事是將預測身高與孩子的實際身高之間的差異轉換為正數。 例如, -5變為+5

之后,計算實際高度和預測高度之間的平均正差(以英寸為單位)。

取絕對差異很重要。 有些孩子比預期的要矮( -2英寸),有些孩子比預期的要高( +7英寸)。

如果您允許負數,則平均高度和實際高度之間的平均差異將始終為零。

  1. 取 1,038 個實際高度。
  2. 從實際高度減去 55 英寸。
  3. 總結高度差異而不轉換為正數
  4. 結果將始終為零。

實際上,定義均值的一種方法是,數字序列的均值是一個數字x ,這樣當您計算每個數據點與x之間的差異時,然后對結果求和,答案為零。

通常,統計學家會平方差異。 由於 Joanna 很矮( -2英寸),Joanna 的平方誤差為+4英寸。

負數乘以負數始終是正數。

平方消除了負面跡象。 取絕對值可以消除負號。 實際上......有大約一百萬種方法可以擺脫負面跡象。

一些統計學家就像 1998 年電影“保利”中的鸚鵡。
我說“炸玉米餅”,他們說“炸玉米餅!炸玉米餅!炸玉米餅!”
他們復制其他統計學家的做法,而且他們從未想過有不止一種方法可以進行統計分析。

我有數學學位,我已經看到證明使均方誤差最小化的曲線在某些方面是理想的。

然而,均方誤差更像是一種啟發式或代理,而不是衡量真正重要的事情。

實際上沒有人有一個公式可以完美地計算數據集 A 和數據集 B,哪個數據集比另一個數據集更“分散”。

很難說人類關心什么。

無論如何,均方誤差總比沒有好。 IT 衡量數據集的分散程度。 一個

數據點離平均值很遠,還是都非常接近平均值?

如果55英寸是 10 歲兒童的真實平均身高會怎樣? 還可以想象“假設”真正的標准偏差是 4 英寸。

在那個虛構的世界中,假設您隨機抽取了 1,038 名兒童,每名 10 歲。

您的樣本方差(根據實驗數據計算)為 7.1091 英寸。

1,038 名兒童樣本的方差為 7.1091 英寸或更大的可能性有多大?

如果您的 model 是正確的,那么數據與您觀察到的模型預測一樣遠或更遠的可能性有多大?

如果您看到數據與預測值相差甚遠,那么您的model可能很糟糕。

無論如何,R平方度量是:

  • 如果數據與 model 完全不匹配,則為 0%
  • 如果數據和預測之間的差異被隨機機會充分解釋,則為 100%。

例如,如果您擲硬幣 1,000 次,那么 491 個結果是正面而不是 500 個結果是“正面”是合理的。

問題是,鑒於 model 表示它應該是 1,000 次中的 500 次左右,觀察到的值(1,000 次投擲中有 491 個正面)是可能的還是非常奇怪的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM