在R中用'[]'拆分字符串向量

Question

我有一个像这样的字符串：

nw.str <- "[D][A|D][T|A:D][C|T]"

我需要以这种方式拆分它：

"[D]" "[A|D]" "[T|A:D]" "[C|T]"

Answer 1

您可以使用strsplit和零宽度断言在base R中执行此操作（它们匹配字符但不使用它们 ）。 基本上我们寻找紧密的括号，然后是开括号和开括号，然后是紧密的括号，并在它们之间分开....

strsplit( x , "(?<=\\])(?=\\[)"  , perl = TRUE )
#[[1]]
#[1] "[D]"     "[A|D]"   "[T|A:D]" "[C|T]"

Answer 2

这里我使用stringr::str_replace_all在值之间插入一个空格。 然后将该字符串拆分到空格处。

> library(stringr)
> s <- str_replace_all(nw.str, fixed("]["), fixed("] ["))
> strsplit(s, " ")[[1]]  ## or unlist(strsplit(...))
# [1] "[D]"     "[A|D]"   "[T|A:D]" "[C|T]"

使用base R的另一种方式（有很多），

> g <- gsub("][", "] [", nw.str, fixed = TRUE)
> unlist(strsplit(g, " "))

Answer 3

使用strapplyc 包中的strapplyc，我们指定要提取的内容（而不是我们想要分割的内容）。

在这种情况下，我们想要提取左方括号"\\\\["后跟任何".*?" （但是最短的东西，而不是问号所示的最长的东西），然后是右方形的brakcet "\\\\]" 。

library(gsubfn)

strapplyc(nw.str, "\\[.*?\\]")[[1]]

赠送：

[1] "[D]"     "[A|D]"   "[T|A:D]" "[C|T]"

Answer 4

一个qdap方法：

library(qdap)
bracketXtract(nw.str, with=TRUE)

##      all1      all2      all3      all4 
##     "[D]"   "[A|D]" "[T|A:D]"   "[C|T]"

Answer 5

这是使用strsplit的方法：

splitted <- strsplit(nw.str,"][", fixed=TRUE)[[1]]
splitted[[1]] <- paste(splitted[[1]], "]", sep="")
splitted[2:length(splitted)-1] <- paste("[", splitted[2:length(splitted)-1], "]", sep="")
splitted[[length(splitted)]] <- paste("[", splitted[[length(splitted)]], sep="")
splitted

在R中用'[]'拆分字符串向量

问题描述

5 个解决方案

解决方案1
6 已采纳 2014-06-08 20:51:52

解决方案2
4 2014-06-08 20:32:20

解决方案3
3 2014-06-08 23:31:03

解决方案4
1 2014-06-09 02:42:20

解决方案5
0 2014-06-08 20:33:13

在R中用&#39;[]&#39;拆分字符串向量

问题描述

5 个解决方案

解决方案1 6 已采纳 2014-06-08 20:51:52

解决方案2 4 2014-06-08 20:32:20

解决方案3 3 2014-06-08 23:31:03

解决方案4 1 2014-06-09 02:42:20

解决方案5 0 2014-06-08 20:33:13

在R中用'[]'拆分字符串向量

解决方案1
6 已采纳 2014-06-08 20:51:52

解决方案2
4 2014-06-08 20:32:20

解决方案3
3 2014-06-08 23:31:03

解决方案4
1 2014-06-09 02:42:20

解决方案5
0 2014-06-08 20:33:13