簡體   English   中英

我如何解釋這個 plot 和摘要(多元線性回歸)

[英]How do i interpret this plot and summary (multivariable linear regression)

我不是 100% 確定如何將 plot 解釋為多變量線性回歸,尤其是除了普通 QQ 以外的所有內容。

根據我的理解,plot 表現出線性或者 model 是一個很好的選擇。

多元線性回歸

至於總結,我認為它顯示了一些基於 R^2 的相當不錯的結果,並調整了 r 的平方以及 F 統計量和 T/p 值。

回歸模型總結

地塊

首先,你的情節......

在此處輸入圖像描述

第一個 plot(左上角)是你的殘差與擬合 plot顯示你的擬合值(回歸預測你的值應該是什么)和你的殘差值(預測有多糟糕)。 它們應該相當均勻地分布在中心線周圍,否則這可能暗示方差相等或曲線存在問題。 從您的 plot 的外觀來看,您的數據似乎被完全擠到了左側,暗示您的數據沒有均勻分布在 plot 上。

第二個 plot(右上角),您的比例位置 plot略有不同,因為 y 軸現在使用標准化殘差。 由於這些是標准化的,它們允許人們查看殘差中的距離是否根據位置發生變化。 紅線應盡可能水平,並且應具有盡可能均勻分布的值。 您的 plot 似乎再次表明情況並非如此。

第三個 plot(左下), QQ plot ,通過用標准化殘差繪制理論分位數來測試您的殘差是否服從正態分布。 繪制的點應該大部分類似於一條直線,兩端只有很小的曲率。 很難確定地說,因為這些圖有點被壓縮成一個 window。但是,看起來殘差看起來大部分是正常的,左邊有輕微的曲線(不是問題),右邊有一些粗曲線(粗尾可能表明散點圖右側的變化問題)。 要查看這是否真的很糟糕,請對原始殘差運行密度 plot 並查看它們是否正常。

最后一個 plot(右下),你的殘差與杠桿 plot ,檢查回歸中點的杠桿作為潛在異常值。 人們對被認為“太高”的數字提出了不同的建議(大於 1、4/n 等)。 最好簡單地檢查一些點是否看起來離其他點太遠,看看它們是否導致了有問題的趨勢。

順便說一句,這些圖中點上顯示的數字顯示了它們的索引位置,因此您可以直接檢查它們。 例如,第一個 plot 中的最高點位於第 49 行。

為了進行比較,這里有一些來自 Karl Pearson 的原始父子身高數據的殘差,這些數據具有相當正常的診斷圖。 請注意順序略有不同,但解釋是相同的:

在此處輸入圖像描述

摘要

第一部分是公式調用,它僅指定您如何對回歸建模。 第二部分顯示殘差的分布方式。 將最小值視為偏離回歸線下方最遠的點,將最大值視為上方最遠的點。 你的中位數應該盡可能接近於零,但只要它不是一些奇怪的數字,只要它相當低,它就可以是任何東西。

系數顯示您的截距和每個預測變量。 在它們旁邊按順序列出的是 1) 斜率,它給出了要乘以它們的原始值以完成線性回歸方程的數字 2) 標准誤差,這是這種關聯的准確度 3) t 值,這是用於檢驗顯着性,以及 4) p 值,用作顯着性“標志”。 您的所有斜率系數都很重要,但不知道這些預測變量的含義會導致難以自信地解釋它們。

以下是您似乎已經知道的一些 model 指標。 請記住,當您有多個預測變量時,調整后的 R 方塊應該具有更大的權重,因為它會懲罰您因預測變量過多而過度擬合的回歸,而正常的 R 方塊將始終隨着預測變量的增加而增加。 f 統計量及其值用於檢驗 model 作為一個整體是否顯着,殘差標准誤差是 model 一般准確度的近似值。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM