[英]How can I access the name of an lm() object in a list of other objects?
我有一些不守规矩的数据,我试图用许多不同的线性模型对其进行建模,我给它们起了不同的名字。 然后我创建了一个名为“比较拟合”的数据框。 我可以使用下面的代码存储来自各种模型的一些更相关的输出。
for(i in 1:length(regressionmodels.listed))
{
comparedfits[i, 2] = summary(regressionmodels.listed[[i]])$df[2]
comparedfits[i, 3] = summary(regressionmodels.listed[[i]])$r.squared
comparedfits[i, 4] = summary(modelnow)$adj.r.squared
#See code snippet below for explanation
#name = deparse(get(substitute(regressionmodels.listed[[i]])))
#names_models[i] = name
}
“列出的回归模型”是我使用简单创建的列表类型对象:
regressionmodels.listed <- list(fit1, fit2 ...etc)
我不能以任何迭代方式做的是:
for(i in 1:length(regressionmodels.listed))
{
namesofmodels[i] = deparse(substitute(regressionmodels.listed[[i]]))
}
请注意,如果我在单个拟合模型上运行解析代码,例如 fit1,它确实有效。 我只是无法让它与拟合模型列表的元素一起工作。 这显然是一件“很高兴”的事情,但由于我将比较 10 个或更多模型,如果我能找到一种方法来做到这一点并将其添加到我上面的其他数据框中,那真的会让我的生活更轻松.
编辑这是regressionmodels.listed的样子:
regressionmodels.listed <- list(lmobject1, lmobject2, lmobject3)
lm 对象是通过在各种数据组合上运行线性模型来创建的。
您的模型列表未命名,因此无法取回“lmobject1”等,一种方法是在开始时命名它们:
regressionmodels.listed <- list(lmobject1, lmobject2, lmobject3)
names(regressionmodels.listed) = c("lmobject1","lmobject2","lmobject3")
#or
names(regressionmodels.listed) = paste0("lmobject",1:length(regressionmodels.listed))
namesofmodels = names(regressionmodels.listed)
另一种选择是使用扫帚:
library(tibble)
library(broom)
library(tidyr)
library(dplyr)
library(purrr)
lm1 = lm(mpg ~ cyl,data=mtcars)
lm2 = lm(mpg ~ disp,data=mtcars)
lm3 = lm(mpg ~ hp,data=mtcars)
res = tibble(models=list(lm1,lm2,lm3))
res = res %>% mutate(names=paste0("model",1:n()),stats=map(models,glance))
# A tibble: 3 x 3
models names stats
<list> <chr> <list>
1 <lm> model1 <tibble [1 × 11]>
2 <lm> model2 <tibble [1 × 11]>
3 <lm> model3 <tibble [1 × 11]>
我们可以取消嵌套:
res %>% unnest(cols=stats)
# A tibble: 3 x 13
models names r.squared adj.r.squared sigma statistic p.value df logLik
<list> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <int> <dbl>
1 <lm> mode… 0.726 0.717 3.21 79.6 6.11e-10 2 -81.7
2 <lm> mode… 0.718 0.709 3.25 76.5 9.38e-10 2 -82.1
3 <lm> mode… 0.602 0.589 3.86 45.5 1.79e- 7 2 -87.6
# … with 4 more variables: AIC <dbl>, BIC <dbl>, deviance <dbl>,
# df.residual <int>
并显示您喜欢的列:
res %>% unnest(cols=stats) %>% select(names,df,r.squared,adj.r.squared)
# A tibble: 3 x 4
names df r.squared adj.r.squared
<chr> <int> <dbl> <dbl>
1 model1 2 0.726 0.717
2 model2 2 0.718 0.709
3 model3 2 0.602 0.589
我想出了这个快速的解决方案。 您想在data.frame
存储来自模型列表(例如来自lm()
线性模型lm()
一些汇总统计信息。 我称这个对象result
为NxP
维度,其中N
是您存储在列表中的模型数量, P
是您要收集的统计数据数量。 在这种情况下,对于自由度、R 平方和调整后的 R 平方, P=3
。
这里我使用的是内置数据mtcars
。
data("mtcars")
mod1 = lm( mpg ~ hp, data = mtcars )
mod2 = lm( mpg ~ wt, data = mtcars )
mod3 = lm( mpg ~ qsec, data = mtcars )
regressionmodels.listed = list( mod1, mod2, mod3 )
N = length( regressionmodels.listed )
results = data.frame( df = rep( NA_integer_, N ),
r.squared = rep( NA_real_, N ),
adj.r.squared = rep( NA_real_, N ) )
for ( i_mod in seq_along( regressionmodels.listed ) ) {
results[ i_mod, "df" ] = regressionmodels.listed[[ i_mod ]]$df
results[ i_mod, "r.squared" ] = summary(regressionmodels.listed[[ i_mod ]])$r.squared
results[ i_mod, "adj.r.squared" ] = summary(regressionmodels.listed[[ i_mod ]])$adj.r.squared
}
这会是你想要的吗? 如果是这样,那么用你的模型替换mod*
,你应该没问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.