R：根據模式更改列名

Question

我有一個非常基本的 R 問題。

我的數據框的列名都有一個獨特的模式：

colnames <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX","MSCI 'COUNTRY NAME 2' - PRICE INDEX",
"MSCI 'COUNTRY NAME 3' - PRICE INDEX","MSCI 'COUNTRY NAME 4' - PRICE INDEX")

一個國家的示例：MSCI 加拿大 - 價格指數。

我想將所有列名更改為國家名稱（在本例中為“加拿大”）。 有沒有快速刪除“MSCI”、“價格指數”和大寫字母的方法？

謝謝！

Answer 1

使用sub作為基本 R 選項：

colnames <- sub("^MSCI '(.*?)'.*$", "\\1", colnames)
colnames

[1] "COUNTRY NAME 1" "COUNTRY NAME 2" "COUNTRY NAME 3" "COUNTRY NAME 4"

數據：

colnames <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX",
              "MSCI 'COUNTRY NAME 2' - PRICE INDEX",
              "MSCI 'COUNTRY NAME 3' - PRICE INDEX",
              "MSCI 'COUNTRY NAME 4' - PRICE INDEX")

如果國家/地區名稱周圍確實沒有單引號，請使用此版本：

name <- "MSCI CANADA - PRICE INDEX"
country <- sub("^MSCI (.*?) - PRICE INDEX$", "\\1", name)

Answer 2

str_extract的一個選項

library(stringr)
str_extract(v1, "(?<=')[^']+")
#[1] "COUNTRY NAME 1" "COUNTRY NAME 2" "COUNTRY NAME 3" "COUNTRY NAME 4"

數據

v1 <- c("MSCI 'COUNTRY NAME 1' - PRICE INDEX", "MSCI 'COUNTRY NAME 2' - PRICE INDEX", 
"MSCI 'COUNTRY NAME 3' - PRICE INDEX", "MSCI 'COUNTRY NAME 4' - PRICE INDEX"
)

R：根據模式更改列名

問題描述

2 個解決方案

解決方案1
2 2020-12-05 09:54:03

解決方案2
0 2020-12-05 16:52:32

數據

R：根據模式更改列名

問題描述

2 個解決方案

解決方案1 2 2020-12-05 09:54:03

解決方案2 0 2020-12-05 16:52:32

數據

解決方案1
2 2020-12-05 09:54:03

解決方案2
0 2020-12-05 16:52:32