[英]Are residuals in linear regression following same order of original data frame row?
[英]Perform same linear regression on different factors within same data frame
我正在處理一個非常大的數據集,並在下面列出了一個簡單的版本
group <- c(rep("A", 3), rep("B", 3), rep("C", 3))
X <- c(0, 1, 2, 0, 1, 2, 0, 1, 2)
Y <- c(0, 2, 4, 0, 3, 6, 0, 4, 8)
df <- data.frame(group, X, Y)
我正在嘗試通過線性回歸來獲得與A,B和C組(因子變量)相對應的三條線的系數。
我遇到了一些R代碼,其中建議在自變量上使用'*'符號來計算(在本示例中)計算線A,B和C的斜率。A,B和C是因素變量。
lin.reg <- lm(Y ~ X*group, data = df)
coefficients_for_ABC <- summary(lin.reg)
我認為我遇到的這段代碼是不正確的,需要應用by函數或類似函數。
這應該工作。 在函數中執行您想做的事情!
lapply(split(df,df$group),function(x){lm( x$Y ~ x$X )})
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.