R，線性回歸，lm，約

Question

我想使用線性回歸從使用線性回歸的計數估算濃度，這是我的數據集的一個樣本：

Concentration   count#0
Ctcf                    3153
Err                 2228
Nkx3-2              4
Isl/                    6
Engrailed               10
Dr                  14
Usf                 461
Dach1/Dac               4185
POS_C(8)    139664      1143
POS_A(128)  2234624     8897
POS_F(0.125)    2182            20
POS_D(2)    34916           220
POS_B(32)   558656      3359
POS_E(0.5)  8729            21

我想知道使用lm然后預測還是使用approx更好。 和approxfun ？ 我不是統計學專家，在Internet上也找不到任何解釋。 謝謝！

Answer 1

如果要擬合普通線性回歸（LR），則使用lm 。 如果您認為您的反應可以通過預測變量的線性組合很好地描述，那么LR可能是合適的。 您不需要數據就可以正常運行LR，但是如果要計算參數等的測試統計信息，則需要（近似）正態性。 同樣，如果您對推理和系數解釋感興趣，請不要忘記檢查常規診斷（殘差均值為0，共同方差且無趨勢，離群值，多重共線性，正態性等）。

LR的實際模型是Y = X %*% beta + e ，其中Y ， beta和e是向量， X是矩陣， %*%表示矩陣乘法。 該表示法假設X的第一列全為1。 缺省情況下， lm使用QR分解，從而避免計算t(X) %*% X甚至t(X) %*% X的倒數，如果X大，則可以節省大量時間。

lm發現[但不是直接計算] solve(t(X) %*% X) %*% t(X) %*% Y ，這為我們提供了beta的唯一估計（假設X為滿秩）。

如果您只想使用普通LR，則您絕對不希望使用其他任何東西。

R，線性回歸，lm，約

問題描述

1 個解決方案

解決方案1
0 2015-03-12 01:11:02

R，線性回歸，lm，約

問題描述

1 個解決方案

解決方案1 0 2015-03-12 01:11:02

解決方案1
0 2015-03-12 01:11:02