r基於字母數字字符拆分列

Question

我在數據幀中有一個列，它是狀態代碼的組合，例如TX和一些id。

GaID
TX1
TX2
NJ2

我想做什么：

State, GaID
TX,TX1
TX,TX2
NJ,NJ2

我尋找拆分功能，但無法弄清楚如何拆分字母數字字符串

Answer 1

我能想到的最簡單的方法是：

dat <- data.frame(GaID = c('TX1', 'TX2', 'NJ2'))

dat[, "State"] <- unlist(strsplit(as.character(dat$GaID), "\\d"))
dat[, 2:1]

##   State GaID
## 1    TX  TX1
## 2    TX  TX2
## 3    NJ  NJ2

Answer 2

如果您知道字符串開頭的條件是兩個字符，則以下內容可能更快（僅在您擁有大型數據集時才會注意到）：

`substr`

substr(dat$GaID, 1, 2)

`sub`

sub("(^[A-Z]{2}).*", "\\1", dat$GaID)

r基於字母數字字符拆分列

問題描述

2 個解決方案

解決方案1
1 2014-01-23 00:28:19

解決方案2
1 已采納 2014-01-23 02:40:23

`substr`

`sub`

r基於字母數字字符拆分列

問題描述

2 個解決方案

解決方案1 1 2014-01-23 00:28:19

解決方案2 1 已采納 2014-01-23 02:40:23

substr

sub

解決方案1
1 2014-01-23 00:28:19

解決方案2
1 已采納 2014-01-23 02:40:23

`substr`

`sub`