繁体   English   中英

"R:向空数据框添加行时丢失列名"

[英]R: losing column names when adding rows to an empty data frame

我刚从 R 开始,遇到了一个奇怪的行为:在空数据框中插入第一行时,原始列名会丢失。

例子:

a<-data.frame(one = numeric(0), two = numeric(0))
a
#[1] one two
#<0 rows> (or 0-length row.names)
names(a)
#[1] "one" "two"
a<-rbind(a, c(5,6))
a
#  X5 X6
#1  5  6
names(a)
#[1] "X5" "X6"

rbind帮助页面指定:

对于'cbind'('rbind'),除非结果为零行(列),否则忽略零长度(包括'NULL')的向量,以实现S兼容性。 (零范围矩阵不会出现在S3中,并且在R中不会被忽略)

所以,事实上,在你的rbind指令中忽略了a 看起来并没有完全忽略,因为它是一个数据框, rbind函数被称为rbind.data.frame

rbind.data.frame(c(5,6))
#  X5 X6
#1  5  6

也许插入行的一种方法可能是:

a[nrow(a)+1,] <- c(5,6)
a
#  one two
#1   5   6

但根据您的代码,可能有更好的方法。

几乎屈服于这个问题。

1)创建数据框,其中stringsAsFactor设置为FALSE或者直接进入下一个问题

2)不要使用rbind - 不知道为什么它在搞乱列名。 简单地这样做:

df[nrow(df)+1,] <- c("d","gsgsgd",4)

df <- data.frame(a = character(0), b=character(0), c=numeric(0))

df[nrow(df)+1,] <- c("d","gsgsgd",4)

#Warnmeldungen:
#1: In `[<-.factor`(`*tmp*`, iseq, value = "d") :
#  invalid factor level, NAs generated
#2: In `[<-.factor`(`*tmp*`, iseq, value = "gsgsgd") :
#  invalid factor level, NAs generated

df <- data.frame(a = character(0), b=character(0), c=numeric(0), stringsAsFactors=F)

df[nrow(df)+1,] <- c("d","gsgsgd",4)

df
#  a      b c
#1 d gsgsgd 4

解决方法是:

a <- rbind(a, data.frame(one = 5, two = 6))

?rbind声明合并对象需要匹配名称:

然后它从第一个数据框中获取列的类,并按名称(而不是按位置)匹配列

FWIW,一种替代设计可能会让您的函数为两列构建向量,而不是重新绑定到数据框:

ones <- c()
twos <- c()

修改函数中的向量:

ones <- append(ones, 5)
twos <- append(twos, 6)

根据需要重复,然后一次创建data.frame:

a <- data.frame(one=ones, two=twos)

一般来说,使用最少量的重新键入列名称的方法是以下方法。 此方法不需要黑客攻击NA或0。

rs <- data.frame(i=numeric(), square=numeric(), cube=numeric())
for (i in 1:4) {
    calc <- c(i, i^2, i^3)
    # append calc to rs
    names(calc) <- names(rs)
    rs <- rbind(rs, as.list(calc))
}

rs将具有正确的名称

> rs
    i square cube
1   1      1    1
2   2      4    8
3   3      9   27
4   4     16   64
> 

另一种更干净的方法是使用data.table:

> df <- data.frame(a=numeric(0), b=numeric(0))
> rbind(df, list(1,2)) # column names are messed up
>   X1 X2
> 1  1  2

> df <- data.table(a=numeric(0), b=numeric(0))
> rbind(df, list(1,2)) # column names are preserved
   a b
1: 1 2

请注意,data.table也是data.frame。

> class(df)
"data.table" "data.frame"

你可以这样做:

给初始数据框一行

 df=data.frame(matrix(nrow=1,ncol=length(newrow))

添加新行并取出NAS

newdf=na.omit(rbind(newrow,df))

但要注意你的新手没有NA,否则它也会被删除。

干杯阿古斯

我使用以下解决方案向空数据框添加一行:

d_dataset <- 
  data.frame(
    variable = character(),
    before = numeric(),
    after = numeric(),
    stringsAsFactors = FALSE)

d_dataset <- 
  rbind(
    d_dataset,
      data.frame(
        variable = "test",
        before = 9,
        after = 12,
        stringsAsFactors = FALSE))  

print(d_dataset)

variable before after  
1     test      9    12

HTH。

亲切的问候

乔治·

而不是使用numeric(0)构造data.frame我使用as.numeric(0)

a<-data.frame(one=as.numeric(0), two=as.numeric(0))

这会创建一个额外的初始行

a
#    one two
#1   0   0

绑定其他行

a<-rbind(a,c(5,6))
a
#    one two
#1   0   0
#2   5   6

然后使用负索引删除第一行(伪造)行

a<-a[-1,]
a

#    one two
#2   5   6

注意:它弄乱了索引(最左边)。 我还没弄明白如何防止这种情况(其他人?),但大多数时候它可能并不重要。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM