[英]How to rename a single column in a data.frame?
我知道如果我有一個多於 1 列的數據框,我可以使用
colnames(x) <- c("col1","col2")
重命名列。 如果它只是一列,我該怎么做? 意味着其中只有一列的向量或數據框。
例子:
trSamp <- data.frame(sample(trainer$index, 10000))
head(trSamp )
# sample.trainer.index..10000.
# 1 5907862
# 2 2181266
# 3 7368504
# 4 1949790
# 5 3475174
# 6 6062879
ncol(trSamp)
# [1] 1
class(trSamp)
# [1] "data.frame"
class(trSamp[1])
# [1] "data.frame"
class(trSamp[,1])
# [1] "numeric"
colnames(trSamp)[2] <- "newname2"
# Error in names(x) <- value :
# 'names' attribute [2] must be the same length as the vector [1]
這是一種通用的方式,您不必記住變量的確切位置:
# df = dataframe
# old.var.name = The name you don't like anymore
# new.var.name = The name you want to get
names(df)[names(df) == 'old.var.name'] <- 'new.var.name'
此代碼幾乎執行以下操作:
names(df)
的外觀到在所有的名字df
[names(df) == old.var.name]
提取你要檢查的變量名<- 'new.var.name'
分配新的變量名。colnames(trSamp)[2] <- "newname2"
嘗試設置第二列的名稱。 您的對象只有一列,因此該命令會引發錯誤。 這應該足夠了:
colnames(trSamp) <- "newname2"
colnames(df)[colnames(df) == 'oldName'] <- 'newName'
這是一個老問題,但值得注意的是,您現在可以使用setnames
從data.table
包。
library(data.table)
setnames(DF, "oldName", "newName")
# or since the data.frame in question is just one column:
setnames(DF, "newName")
# And for reference's sake, in general (more than once column)
nms <- c("col1.name", "col2.name", etc...)
setnames(DF, nms)
這也可以使用 Hadley 的plyr
包和rename
函數來完成。
library(plyr)
df <- data.frame(foo=rnorm(1000))
df <- rename(df,c('foo'='samples'))
您可以按名稱重命名(不知道位置)並一次執行多個重命名。 例如,在進行合並后,您可能會得到:
letterid id.x id.y
1 70 2 1
2 116 6 5
3 116 6 4
4 116 6 3
5 766 14 9
6 766 14 13
然后您可以使用以下方法一步重命名:
letters <- rename(letters,c("id.x" = "source", "id.y" = "target"))
letterid source target
1 70 2 1
2 116 6 5
3 116 6 4
4 116 6 3
5 766 14 9
6 766 14 13
我認為重命名列的最佳方法是使用dplyr包,如下所示:
require(dplyr)
df = rename(df, new_col01 = old_col01, new_col02 = old_col02, ...)
對於重命名任何數據集中的一列或多列,它的工作原理相同。
我發現重命名單個列的最方便的方法是使用dplyr::rename_at
:
library(dplyr)
cars %>% rename_at("speed",~"new") %>% head
cars %>% rename_at(vars(speed),~"new") %>% head
cars %>% rename_at(1,~"new") %>% head
# new dist
# 1 4 2
# 2 4 10
# 3 7 4
# 4 7 22
# 5 8 16
# 6 9 10
我喜歡下一個樣式,用於逐個重命名數據框列名稱。
colnames(df)[which(colnames(df) == 'old_colname')] <- 'new_colname'
在哪里
which(colnames(df) == 'old_colname')
按特定列的索引返回。
您可以使用gdata
包中的rename.vars
。
library(gdata)
df <- rename.vars(df, from = "oldname", to = "newname")
當您有多個變量名稱要更改,或者您想在變量名稱后附加或預先添加一些文本時,這尤其有用,然后您可以執行以下操作:
df <- rename.vars(df, from = c("old1", "old2", "old3",
to = c("new1", "new2", "new3"))
有關將文本附加到變量名稱子集的示例,請參閱: https : //stackoverflow.com/a/28870000/180892
讓 df 成為您的數據框,col 名稱為 myDays 和 temp。 如果要將“myDays”重命名為“Date”,
library(plyr)
rename(df,c("myDays" = "Date"))
或者用管道,你可以
dfNew <- df %>%
plyr::rename(c("myDays" = "Date"))
這可能已經存在了,但是我在尋找解決方案時正在重命名字段並一時興起嘗試了這個。 為我的目的工作。
Table1$FieldNewName <- Table1$FieldOldName
Table1$FieldOldName <- NULL
編輯從這里開始......
這也有效。
df <- rename(df, c("oldColName" = "newColName"))
嘗試:
colnames(x)[2] <- 'newname2'
您也可以嘗試使用“Hmisc”包中的“upData”。
library(Hmisc)
trSamp = upData(trSamp, rename=c(sample.trainer.index..10000. = 'newname2'))
如果你知道你的數據names(trSamp) <- "newname2"
只有一列,你可以使用: names(trSamp) <- "newname2"
OP的問題得到了很好的回答。 但是,這里有一個在某些情況下可能有用的技巧:列名的部分匹配,不管它在數據框中的位置:
名稱部分匹配:
d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
## name1 Reported.Cases..WHO..2011. name3
## 1 NA NA NA
names(d)[grepl("Reported", names(d))] <- "name2"
## name1 name2 name3
## 1 NA NA NA
另一個例子:對“標點符號”的存在進行部分匹配:
d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
## name1 Reported.Cases..WHO..2011. name3
## 1 NA NA NA
names(d)[grepl("[[:punct:]]", names(d))] <- "name2"
## name1 name2 name3
## 1 NA NA NA
這些是我今天必須處理的例子,我認為可能值得分享。
我只需使用我想要的名稱向數據框中添加一個新列,並從現有列中獲取它的數據。 像這樣:
dataf$value=dataf$Article1Order
然后我刪除舊列! 像這樣:
dataf$Article1Order<-NULL
這段代碼可能看起來很傻! 但它完美地工作......
我發現colnames()
參數更容易https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/row%2Bcolnames
從數據框中選擇一些列
df <- data.frame(df[, c( "hhid","b1005", "b1012_imp", "b3004a")])
並按順序重命名所選列,
colnames(df) <- c("hhid", "income", "cost", "credit")
檢查名稱和值以確保
names(df);head(df)
我們可以使用rename_with
通過函數(例如stringr
函數)重命名列。
考慮以下數據df_1
:
df_1 <- data.frame(
x = replicate(n = 3, expr = rnorm(n = 3, mean = 10, sd = 1)),
y = sample(x = 1:2, size = 10, replace = TRUE)
)
names(df_1)
#[1] "x.1" "x.2" "x.3" "y"
使用dplyr::everything()
重命名所有變量:
library(tidyverse)
df_1 %>%
rename_with(.data = ., .cols = everything(.),
.fn = str_replace, pattern = '.*',
replacement = str_c('var', seq_along(.), sep = '_')) %>%
names()
#[1] "var_1" "var_2" "var_3" "var_4"
使用一些dplyr
動詞( starts_with
、 ends_with
、 contains
、 matches
、...)按名稱粒子重命名。
以 為例.
( x
變量):
df_1 %>%
rename_with(.data = ., .cols = contains('.'),
.fn = str_replace, pattern = '.*',
replacement = str_c('var', seq_along(.), sep = '_')) %>%
names()
#[1] "var_1" "var_2" "var_3" "y"
使用類測試的許多功能按類重命名,例如is.integer
、 is.numeric
、 is.factor
...
is.integer
( y
) 示例:
df_1 %>%
rename_with(.data = ., .cols = is.integer,
.fn = str_replace, pattern = '.*',
replacement = str_c('var', seq_along(.), sep = '_')) %>%
names()
#[1] "x.1" "x.2" "x.3" "var_1"
警告:
警告消息: 1:在 stri_replace_first_regex(string, pattern, fix_replacement(replacement), :較長的對象長度不是較短對象長度的倍數 2:在 names[cols] <- .fn(names[cols], ...) : 要替換的項目數不是替換長度的倍數
它不相關,因為它只是seq_along(.)
與替換函數的不一致。
我只需使用以下代碼將列名更改為具有我想要的新名稱的數據集: names(dataset)[index_value] <- "new_col_name"
library(dplyr)
rename(data, de=de.y)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.