簡體   English   中英

R:根據模式更改列名

[英]R:Change Column Names based on pattern

我有一個非常基本的 R 問題。

我的數據框的列名都有一個獨特的模式:

colnames <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX","MSCI 'COUNTRY NAME 2' - PRICE INDEX",
"MSCI 'COUNTRY NAME 3' - PRICE INDEX","MSCI 'COUNTRY NAME 4' - PRICE INDEX")

一個國家的示例:MSCI 加拿大 - 價格指數。

我想將所有列名更改為國家名稱(在本例中為“加拿大”)。 有沒有快速刪除“MSCI”、“價格指數”和大寫字母的方法?

謝謝!

使用sub作為基本 R 選項:

colnames <- sub("^MSCI '(.*?)'.*$", "\\1", colnames)
colnames

[1] "COUNTRY NAME 1" "COUNTRY NAME 2" "COUNTRY NAME 3" "COUNTRY NAME 4"

數據:

colnames <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX",
              "MSCI 'COUNTRY NAME 2' - PRICE INDEX",
              "MSCI 'COUNTRY NAME 3' - PRICE INDEX",
              "MSCI 'COUNTRY NAME 4' - PRICE INDEX")

如果國家/地區名稱周圍確實沒有單引號,請使用此版本:

name <- "MSCI CANADA - PRICE INDEX"
country <- sub("^MSCI (.*?) - PRICE INDEX$", "\\1", name)

str_extract的一個選項

library(stringr)
str_extract(v1, "(?<=')[^']+")
#[1] "COUNTRY NAME 1" "COUNTRY NAME 2" "COUNTRY NAME 3" "COUNTRY NAME 4"

數據

v1 <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX", "MSCI 'COUNTRY NAME 2' - PRICE INDEX", 
"MSCI 'COUNTRY NAME 3' - PRICE INDEX", "MSCI 'COUNTRY NAME 4' - PRICE INDEX"
)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM