[英]R, linear regression, lm, approx
我想使用線性回歸從使用線性回歸的計數估算濃度,這是我的數據集的一個樣本:
Concentration count#0
Ctcf 3153
Err 2228
Nkx3-2 4
Isl/ 6
Engrailed 10
Dr 14
Usf 461
Dach1/Dac 4185
POS_C(8) 139664 1143
POS_A(128) 2234624 8897
POS_F(0.125) 2182 20
POS_D(2) 34916 220
POS_B(32) 558656 3359
POS_E(0.5) 8729 21
我想知道使用lm
然后預測還是使用approx
更好。 和approxfun
? 我不是統計學專家,在Internet上也找不到任何解釋。 謝謝!
如果要擬合普通線性回歸(LR),則使用lm
。 如果您認為您的反應可以通過預測變量的線性組合很好地描述,那么LR可能是合適的。 您不需要數據就可以正常運行LR,但是如果要計算參數等的測試統計信息,則需要(近似)正態性。 同樣,如果您對推理和系數解釋感興趣,請不要忘記檢查常規診斷(殘差均值為0,共同方差且無趨勢,離群值,多重共線性,正態性等)。
LR的實際模型是Y = X %*% beta + e
,其中Y
, beta
和e
是向量, X
是矩陣, %*%
表示矩陣乘法。 該表示法假設X
的第一列全為1。 缺省情況下, lm
使用QR分解,從而避免計算t(X) %*% X
甚至t(X) %*% X
的倒數,如果X
大,則可以節省大量時間。
lm
發現[但不是直接計算] solve(t(X) %*% X) %*% t(X) %*% Y
,這為我們提供了beta
的唯一估計(假設X
為滿秩)。
如果您只想使用普通LR,則您絕對不希望使用其他任何東西。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.