如何重命名 data.frame 中的單個列？

Question

我知道如果我有一個多於 1 列的數據框，我可以使用

colnames(x) <- c("col1","col2")

重命名列。 如果它只是一列，我該怎么做？ 意味着其中只有一列的向量或數據框。

例子：

trSamp <- data.frame(sample(trainer$index, 10000))
head(trSamp )
#   sample.trainer.index..10000.
# 1                      5907862
# 2                      2181266
# 3                      7368504
# 4                      1949790
# 5                      3475174
# 6                      6062879

ncol(trSamp)
# [1] 1
class(trSamp)
# [1] "data.frame"
class(trSamp[1])
# [1] "data.frame"
class(trSamp[,1])
# [1] "numeric"
colnames(trSamp)[2] <- "newname2"
# Error in names(x) <- value : 
#   'names' attribute [2] must be the same length as the vector [1]

Answer 1

這是一種通用的方式，您不必記住變量的確切位置：

# df = dataframe
# old.var.name = The name you don't like anymore
# new.var.name = The name you want to get

names(df)[names(df) == 'old.var.name'] <- 'new.var.name'

此代碼幾乎執行以下操作：

names(df)的外觀到在所有的名字df
[names(df) == old.var.name]提取你要檢查的變量名
<- 'new.var.name'分配新的變量名。

Answer 2

colnames(trSamp)[2] <- "newname2"

嘗試設置第二列的名稱。 您的對象只有一列，因此該命令會引發錯誤。 這應該足夠了：

colnames(trSamp) <- "newname2"

Answer 3

colnames(df)[colnames(df) == 'oldName'] <- 'newName'

Answer 4

這是一個老問題，但值得注意的是，您現在可以使用setnames從data.table包。

library(data.table)

setnames(DF, "oldName", "newName")

# or since the data.frame in question is just one column: 
setnames(DF, "newName")

# And for reference's sake, in general (more than once column)
nms <- c("col1.name", "col2.name", etc...)
setnames(DF, nms)

Answer 5

這也可以使用 Hadley 的plyr包和rename函數來完成。

library(plyr) 
df <- data.frame(foo=rnorm(1000)) 
df <- rename(df,c('foo'='samples'))

您可以按名稱重命名（不知道位置）並一次執行多個重命名。 例如，在進行合並后，您可能會得到：

  letterid id.x id.y
1       70    2    1
2      116    6    5
3      116    6    4
4      116    6    3
5      766   14    9
6      766   14   13

然后您可以使用以下方法一步重命名：

letters <- rename(letters,c("id.x" = "source", "id.y" = "target"))

  letterid source target
1       70      2      1
2      116      6      5
3      116      6      4
4      116      6      3
5      766     14      9
6      766     14     13

Answer 6

我認為重命名列的最佳方法是使用dplyr包，如下所示：

require(dplyr)
df = rename(df, new_col01 = old_col01, new_col02 = old_col02, ...)

對於重命名任何數據集中的一列或多列，它的工作原理相同。

Answer 7

我發現重命名單個列的最方便的方法是使用dplyr::rename_at ：

library(dplyr)
cars %>% rename_at("speed",~"new") %>% head     
cars %>% rename_at(vars(speed),~"new") %>% head
cars %>% rename_at(1,~"new") %>% head

#   new dist
# 1   4    2
# 2   4   10
# 3   7    4
# 4   7   22
# 5   8   16
# 6   9   10

在管鏈中運行良好
當名稱存儲在變量中時很方便
使用名稱或列索引
清晰緊湊

Answer 8

我喜歡下一個樣式，用於逐個重命名數據框列名稱。

colnames(df)[which(colnames(df) == 'old_colname')] <- 'new_colname'

在哪里

which(colnames(df) == 'old_colname')

按特定列的索引返回。

Answer 9

您可以使用gdata包中的rename.vars 。

library(gdata)
df <- rename.vars(df, from = "oldname", to = "newname")

當您有多個變量名稱要更改，或者您想在變量名稱后附加或預先添加一些文本時，這尤其有用，然后您可以執行以下操作：

df <- rename.vars(df, from = c("old1", "old2", "old3", 
         to = c("new1", "new2", "new3"))

有關將文本附加到變量名稱子集的示例，請參閱： https : //stackoverflow.com/a/28870000/180892

Answer 10

讓 df 成為您的數據框，col 名稱為 myDays 和 temp。 如果要將“myDays”重命名為“Date”，

library(plyr)
rename(df,c("myDays" = "Date"))

或者用管道，你可以

dfNew      <- df %>% 
  plyr::rename(c("myDays" = "Date"))

Answer 11

這可能已經存在了，但是我在尋找解決方案時正在重命名字段並一時興起嘗試了這個。 為我的目的工作。

Table1$FieldNewName <- Table1$FieldOldName
Table1$FieldOldName <- NULL

編輯從這里開始......

這也有效。

df <- rename(df, c("oldColName" = "newColName"))

Answer 12

嘗試：

colnames(x)[2] <- 'newname2'

Answer 13

您也可以嘗試使用“Hmisc”包中的“upData”。

library(Hmisc)

trSamp = upData(trSamp, rename=c(sample.trainer.index..10000. = 'newname2'))

Answer 14

如果你知道你的數據names(trSamp) <- "newname2"只有一列，你可以使用： names(trSamp) <- "newname2"

Answer 15

OP的問題得到了很好的回答。 但是，這里有一個在某些情況下可能有用的技巧：列名的部分匹配，不管它在數據框中的位置：

名稱部分匹配：

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("Reported", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

另一個例子：對“標點符號”的存在進行部分匹配：

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("[[:punct:]]", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

這些是我今天必須處理的例子，我認為可能值得分享。

Answer 16

我只需使用我想要的名稱向數據框中添加一個新列，並從現有列中獲取它的數據。 像這樣：

dataf$value=dataf$Article1Order

然后我刪除舊列！ 像這樣：

dataf$Article1Order<-NULL

這段代碼可能看起來很傻！ 但它完美地工作......

Answer 17

我發現colnames()參數更容易https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/row%2Bcolnames

從數據框中選擇一些列

df <- data.frame(df[, c( "hhid","b1005", "b1012_imp", "b3004a")])

並按順序重命名所選列，

colnames(df) <- c("hhid", "income", "cost", "credit")

檢查名稱和值以確保

names(df);head(df)

Answer 18

我們可以使用rename_with通過函數（例如stringr函數）重命名列。

考慮以下數據df_1 ：

df_1 <- data.frame(
  x = replicate(n = 3, expr = rnorm(n = 3, mean = 10, sd = 1)), 
  y = sample(x = 1:2, size = 10, replace = TRUE)
)

names(df_1)

#[1] "x.1" "x.2" "x.3" "y"

使用dplyr::everything()重命名所有變量：

library(tidyverse)

df_1 %>% 
  rename_with(.data = ., .cols = everything(.), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "var_4"

使用一些dplyr動詞（ starts_with 、 ends_with 、 contains 、 matches 、...）按名稱粒子重命名。

以為例. ( x變量):

df_1 %>% 
  rename_with(.data = ., .cols = contains('.'), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "y"

使用類測試的許多功能按類重命名，例如is.integer 、 is.numeric 、 is.factor ...

is.integer ( y ) 示例：

df_1 %>% 
  rename_with(.data = ., .cols = is.integer, 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "x.1"   "x.2"   "x.3"   "var_1"

警告：

警告消息： 1：在 stri_replace_first_regex(string, pattern, fix_replacement(replacement), ：較長的對象長度不是較短對象長度的倍數 2：在 names[cols] <- .fn(names[cols], ...) : 要替換的項目數不是替換長度的倍數

它不相關，因為它只是seq_along(.)與替換函數的不一致。

Answer 19

我只需使用以下代碼將列名更改為具有我想要的新名稱的數據集： names(dataset)[index_value] <- "new_col_name"

Answer 20

library(dplyr)
rename(data, de=de.y)

如何重命名 data.frame 中的單個列？

問題描述

20 個解決方案

解決方案1
668 2013-05-10 20:33:31

解決方案2
412 已采納 2011-09-23 17:01:46

解決方案3
100 2014-05-05 14:53:01

解決方案4
84 2013-10-03 21:19:24

解決方案5
59 2013-08-26 16:02:49

解決方案6
47 2017-07-15 17:43:51

解決方案7
18 2018-03-24 21:43:51

解決方案8
14 2014-01-08 07:50:01

解決方案9
7 2017-03-20 01:56:08

解決方案10
6 2020-07-24 06:57:06

解決方案11
5 2017-01-31 21:43:23

解決方案12
5 2011-09-23 16:10:10

解決方案13
4 2012-07-29 09:55:31

解決方案14
3

解決方案15
2

解決方案16
0 2018-12-18 06:58:38

解決方案17
0 2019-11-24 11:54:48

解決方案18
0 2020-05-25 20:21:52

解決方案19
-1 2019-03-04 22:56:13

解決方案20
-3 2019-07-24 07:55:20

如何重命名 data.frame 中的單個列？

問題描述

20 個解決方案

解決方案1 668 2013-05-10 20:33:31

解決方案2 412 已采納 2011-09-23 17:01:46

解決方案3 100 2014-05-05 14:53:01

解決方案4 84 2013-10-03 21:19:24

解決方案5 59 2013-08-26 16:02:49

解決方案6 47 2017-07-15 17:43:51

解決方案7 18 2018-03-24 21:43:51

解決方案8 14 2014-01-08 07:50:01

解決方案9 7 2017-03-20 01:56:08

解決方案10 6 2020-07-24 06:57:06

解決方案11 5 2017-01-31 21:43:23

解決方案12 5 2011-09-23 16:10:10

解決方案13 4 2012-07-29 09:55:31

解決方案14 3

解決方案15 2

解決方案16 0 2018-12-18 06:58:38

解決方案17 0 2019-11-24 11:54:48

解決方案18 0 2020-05-25 20:21:52

解決方案19 -1 2019-03-04 22:56:13

解決方案20 -3 2019-07-24 07:55:20

解決方案1
668 2013-05-10 20:33:31

解決方案2
412 已采納 2011-09-23 17:01:46

解決方案3
100 2014-05-05 14:53:01

解決方案4
84 2013-10-03 21:19:24

解決方案5
59 2013-08-26 16:02:49

解決方案6
47 2017-07-15 17:43:51

解決方案7
18 2018-03-24 21:43:51

解決方案8
14 2014-01-08 07:50:01

解決方案9
7 2017-03-20 01:56:08

解決方案10
6 2020-07-24 06:57:06

解決方案11
5 2017-01-31 21:43:23

解決方案12
5 2011-09-23 16:10:10

解決方案13
4 2012-07-29 09:55:31

解決方案14
3

解決方案15
2

解決方案16
0 2018-12-18 06:58:38

解決方案17
0 2019-11-24 11:54:48

解決方案18
0 2020-05-25 20:21:52

解決方案19
-1 2019-03-04 22:56:13

解決方案20
-3 2019-07-24 07:55:20