簡體   English   中英

R,線性回歸,lm,約

[英]R, linear regression, lm, approx

我想使用線性回歸從使用線性回歸的計數估算濃度,這是我的數據集的一個樣本:

Concentration   count#0
Ctcf                    3153
Err                 2228
Nkx3-2              4
Isl/                    6
Engrailed               10
Dr                  14
Usf                 461
Dach1/Dac               4185
POS_C(8)    139664      1143
POS_A(128)  2234624     8897
POS_F(0.125)    2182            20
POS_D(2)    34916           220
POS_B(32)   558656      3359
POS_E(0.5)  8729            21

我想知道使用lm然后預測還是使用approx更好。 approxfun 我不是統計學專家,在Internet上也找不到任何解釋。 謝謝!

如果要擬合普通線性回歸(LR),則使用lm 如果您認為您的反應可以通過預測變量的線性組合很好地描述,那么LR可能是合適的。 您不需要數據就可以正常運行LR,但是如果要計算參數等的測試統計信息,則需要(近似)正態性。 同樣,如果您對推理和系數解釋感興趣,請不要忘記檢查常規診斷(殘差均值為0,共同方差且無趨勢,離群值,多重共線性,正態性等)。

LR的實際模型是Y = X %*% beta + e ,其中Ybetae是向量, X是矩陣, %*%表示矩陣乘法。 該表示法假設X的第一列全為1。 缺省情況下, lm使用QR分解,從而避免計算t(X) %*% X甚至t(X) %*% X的倒數,如果X大,則可以節省大量時間。

lm發現[但不是直接計算] solve(t(X) %*% X) %*% t(X) %*% Y ,這為我們提供了beta的唯一估計(假設X為滿秩)。

如果您只想使用普通LR,則您絕對不希望使用其他任何東西。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM