繁体   English   中英

从 R dataframe 中的列名中去除字符的更有效方法?

[英]A more efficient way to strip a character from column names in an R dataframe?

我想从这个 R 数据框中的列名中删除 X。

> d
     days X2000 X2001 X2002 X2003
1 June-01    90    85    88    75
2 June-02    93    84    88    81
3 June-03    94    83    85    83

这是我到目前为止所得到的。 它通过获取第 2 到第 5 列的 substring 得到我想要的列名。

> new_colnames <- c()
> for (name in colnames(d[2:5])) { new_colnames <- c(new_colnames, substring(name, 2)) }
> colnames(d) <- c('days', new_colnames)
> d
     days 2000 2001 2002 2003
1 June-01   90   85   88   75
2 June-02   93   84   88   81
3 June-03   94   83   85   83

有没有更有效的方法来做到这一点? 什么是“最佳实践”?

正如上面已经有人建议的那样,您只需要使用sub命令。 我在上面重新创建了您的数据库并这样做了:

# Load piping library:
library(tidyverse)

# Create days variable:
days <- c("June-01",
          "June-02",
          "June-03")

# Create year variables:
X2000 <- c(90,93,94)
X2001 <- c(85,84,83)
X2002 <- c(88,88,85)
X2003 <- c(75,81,83)

# Make data frame with variables:
df <- data.frame(days,
           X2000,
           X2001,
           X2002,
           X2003)

此时,您应该拥有与上面相同的数据框:

    Xdays X2000 X2001 X2002 X2003
1 June-01    90    85    88    75
2 June-02    93    84    88    81
3 June-03    94    83    85    83

从这里您只需要更改名称:

# Change names:
names(df) <- sub("X", "", names(df))

# Print:
df

这应该打印这个新表:

     days 2000 2001 2002 2003
1 June-01   90   85   88   75
2 June-02   93   84   88   81
3 June-03   94   83   85   83

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM