![](/img/trans.png)
[英]Change single cells in column based on string pattern in other column in R
[英]R:Change Column Names based on pattern
我有一個非常基本的 R 問題。
我的數據框的列名都有一個獨特的模式:
colnames <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX","MSCI 'COUNTRY NAME 2' - PRICE INDEX",
"MSCI 'COUNTRY NAME 3' - PRICE INDEX","MSCI 'COUNTRY NAME 4' - PRICE INDEX")
一個國家的示例:MSCI 加拿大 - 價格指數。
我想將所有列名更改為國家名稱(在本例中為“加拿大”)。 有沒有快速刪除“MSCI”、“價格指數”和大寫字母的方法?
謝謝!
使用sub
作為基本 R 選項:
colnames <- sub("^MSCI '(.*?)'.*$", "\\1", colnames)
colnames
[1] "COUNTRY NAME 1" "COUNTRY NAME 2" "COUNTRY NAME 3" "COUNTRY NAME 4"
數據:
colnames <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX",
"MSCI 'COUNTRY NAME 2' - PRICE INDEX",
"MSCI 'COUNTRY NAME 3' - PRICE INDEX",
"MSCI 'COUNTRY NAME 4' - PRICE INDEX")
如果國家/地區名稱周圍確實沒有單引號,請使用此版本:
name <- "MSCI CANADA - PRICE INDEX"
country <- sub("^MSCI (.*?) - PRICE INDEX$", "\\1", name)
str_extract
的一個選項
library(stringr)
str_extract(v1, "(?<=')[^']+")
#[1] "COUNTRY NAME 1" "COUNTRY NAME 2" "COUNTRY NAME 3" "COUNTRY NAME 4"
v1 <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX", "MSCI 'COUNTRY NAME 2' - PRICE INDEX",
"MSCI 'COUNTRY NAME 3' - PRICE INDEX", "MSCI 'COUNTRY NAME 4' - PRICE INDEX"
)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.