繁体   English   中英

使用列名创建空data.frame

[英]Create empty data.frame with column names

我正在尝试创建一个包含两列和未知行数的空数据框。 我想指定列的名称。 我运行了以下命令

dat <- data.frame("id"=numeric(),"nobs"=numeric())  

我可以通过运行来测试结果

> str(dat)
'data.frame':   0 obs. of  2 variables:
 $ id  : num 
 $ nobs: num   

但是稍后当我使用以下命令中的rbind将数据插入此数据框时,列的名称也会更改

  for (i in id) {
    nobs = nrow(na.omit(read.csv(files_list[i])))
    dat = rbind(dat, c(i,nobs))
  } 

在for循环之后,这是dat的值

dat
  X3 X243
1  3  243

str命令显示以下内容

str(dat)

'data.frame':   1 obs. of  2 variables:
 $ X3  : num 3
 $ X243: num 243

任何人都可以告诉为什么数据框中的列名称会发生​​变化

编辑:

我解决这个问题的懒惰解决方案是在for循环之后运行以下命令,将数据绑定到我的data.frame

names(dat)[1] = "id"
names(dat)[2] = "nobs"

有趣的是, rbind.data.frame函数抛弃了所有传递的零行数值。 它基本上发生在这一行

allargs <- allargs[nr > 0L]

所以传入没有行的data.frame,实际上就像没有传递任何东西一样。 另一个很好的例子,为什么尝试逐行构建data.frame几乎总是一个坏主意。 更好地构建向量,然后仅在完成时组合成data.frame。

dat = data.frame(col1=numeric(), col2=numeric())  

...loop
    dat[, dim(dat)[1] + 1] = c(324, 234) 

这样可以保留列名称

我会改变你将数据附加到数据框的方式。 由于rbind似乎删除了列名,只需替换索引位置即可。

dat <- data.frame("id"=numeric(),"nobs"=numeric())  

for (i in id) {
   dat[i,] <- nrow(na.omit(read.csv(files_list[i])))

 } 

仅供参考,默认数据框创建会将所有字符串转换为因子,而不是此处的问题,因为所有数据格式都是数字格式。 但是如果你有一个character(),你可能想要关闭默认的stringsAsFactors = FALSE,以附加字符列表。

您应该尝试在rbind()中指定列名:

dat = rbind(dat, data.frame("id" = i, "nobs" = nobs))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM