繁体   English   中英

R中的变量名称向量

[英]vector of variable names in R

我想创建一个自动生成单变量和多变量回归分析的函数,但我无法弄清楚如何在向量中指定**变量... **这看起来很简单,但略读文档我到目前为止还没弄明白......

简单的例子

a<-rnorm(100)
b<-rnorm(100)
k<-c("a","b")
d<-c(a,b)
summary(k[1])

但是k [1] =“a”并且是一个字符向量... d只是b附加到a,而不是变量名。 实际上,我希望k [1]代表向量a。

感谢任何答案......

//中号

您可以使用“get”函数根据其名称的字符串获取对象,但从长远来看,最好将变量存储在列表中并以这种方式访问​​它们,事情变得更加简单,您可以抓取子集,您可以使用lapply或sapply在每个元素上运行相同的代码。 保存或删除时,您可以只处理整个列表,而不是尝试记住每个元素。 例如:

mylist <- list(a=rnorm(100), b=rnorm(100) )
names(mylist)
summary(mylist[[1]])
# or
summary(mylist[['a']])
# or
summary(mylist$a)
# or 
d <- 'a'
summary(mylist[[d]])

# or
lapply( mylist, summary )

如果您以编程方式创建用于使用lm(或其他建模函数)进行分析的模型,那么一种方法是仅对您的数据进行子集化并使用“。”,例如:

yvar <- 'Sepal.Width'
xvars <- c('Petal.Width','Sepal.Length')
fit <- lm( Sepal.Width ~ ., data=iris[, c(yvar,xvars)] )

或者您可以使用“paste”或“sprintf”构建公式,然后使用“as.formula”将其转换为公式,例如:

yvar <- 'Sepal.Width'
xvars <- c('Petal.Width','Sepal.Length')
my.formula <- paste( yvar, '~', paste( xvars, collapse=' + ' ) )
my.formula <- as.formula(my.formula)
fit <- lm( my.formula, data=iris )

如果您正在查看自动适合的许多不同模型,请注意多重比较的问题。

你可以使用列表k=list(a,b) 这将创建一个包含组件a和b的列表,但不是变量名列表。

get()正是您要找的:

summary(get(k[1]))

编辑:get()不是你要找的,它是list()。 get()也可能有用。

如果您正在寻找自动生成回归分析,您实际上可能会受益于使用eval(),尽管每个R程序员都会警告您使用eval(),除非您非常清楚自己在做什么。 在使用它们之前,请仔细阅读有关eval()和parse()的帮助文件。

一个例子 :

d <- data.frame(
  var1 = rnorm(1000),
  var2 = rpois(1000,4),
  var3 = sample(letters[1:3],1000,replace=T)
)

vars <- names(d)

auto.lm <- function(d,dep,indep){
      expr <- paste(
          "out <- lm(",
          dep,
          "~",
          paste(indep,collapse="*"),
          ",data=d)"
      )
      eval(parse(text=expr))
      return(out)
}

auto.lm(d,vars[1],vars[2:3])

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM