通过多个分隔符拆分列，保留分隔符

Question

如何使用％， - 和+作为可能的分隔符将字符列拆分为3列，并将分隔符保留在新列中？

示例数据：

data <- data.table(x=c("92.1%+100-200","90.4%-1000+200", "92.8%-200+100", "99.2%-500-200","90.1%+500-200"))

示例所需数据：

data.desired <- data.table(x1=c("92.1%", "90.4%", "92.8%","99.2%","90.1%")
                           , x2=c("+100","-1000","-200","-500","+500")
                           , x3=c("-200","+200","+100","-200","-200"))

很高兴为这个问题提供一个好的答案和一些帮助！

Answer 1

我们可以separate使用tidyr进行拆分，并使用正向tidyr来保留分隔符：

data %>% separate(x, c("x1", "x2", "x3"), sep = "(?=\\+|-)")
#       x1    x2   x3
# 1: 92.1%  +100 -200
# 2: 90.4% -1000 +200
# 3: 92.8%  -200 +100
# 4: 99.2%  -500 -200
# 5: 90.1%  +500 -200

也就是说，请注意简单地用\\\\+|-分割，我们会得到

data %>% separate(x, c("x1", "x2", "x3"), sep = "\\+|-")
#       x1   x2  x3
# 1: 92.1%  100 200
# 2: 90.4% 1000 200
# 3: 92.8%  200 100
# 4: 99.2%  500 200
# 5: 90.1%  500 200

使用(?=\\\\+|-)拆分为“无”，以后我们有+或- （不匹配）。

Answer 2

在data.table ，等效的是tstrsplit ：

data[, c("x1","x2","x3") := tstrsplit(x, "(?<=.)(?=[+-])", perl=TRUE) ]
data
#                x    x1    x2   x3
#1:  92.1%+100-200 92.1%  +100 -200
#2: 90.4%-1000+200 90.4% -1000 +200
#3:  92.8%-200+100 92.8%  -200 +100
#4:  99.2%-500-200 99.2%  -500 -200
#5:  90.1%+500-200 90.1%  +500 -200

Answer 3

这是使用base R的选项

cbind(data, read.csv(text = gsub("(?=[+-])", ",", data$x, perl = TRUE), 
    header = FALSE, stringsAsFactors = FALSE, col.names = c('x1', 'x2', 'x3')))
#                x    x1    x2   x3
#1:  92.1%+100-200 92.1%   100 -200
#2: 90.4%-1000+200 90.4% -1000  200
#3:  92.8%-200+100 92.8%  -200  100
#4:  99.2%-500-200 99.2%  -500 -200
#5:  90.1%+500-200 90.1%   500 -200

通过多个分隔符拆分列，保留分隔符

问题描述

3 个解决方案

解决方案1
3 2018-12-11 00:21:12

解决方案2
2 已采纳 2018-12-11 00:40:55

解决方案3
2 2018-12-11 02:23:29

通过多个分隔符拆分列，保留分隔符

问题描述

3 个解决方案

解决方案1 3 2018-12-11 00:21:12

解决方案2 2 已采纳 2018-12-11 00:40:55

解决方案3 2 2018-12-11 02:23:29

解决方案1
3 2018-12-11 00:21:12

解决方案2
2 已采纳 2018-12-11 00:40:55

解决方案3
2 2018-12-11 02:23:29