提取所有出现的两个字符串之间不同的字符

Question

我已经使用adist来计算两个字符串之间不同的字符数：

a <- "#IvoryCoast TENNIS US OPEN Clément «Un beau combat» entre Simon et Cilic"
b <- "Clément «Un beau combat» entre Simon et Cilic"
adist(a,b) # result 27

现在，我想提取所有这些不同字符的出现 。 在我的示例中，我想获取字符串"#IvoryCoast TENNIS US OPEN " 。

我尝试并使用：

paste(Reduce(setdiff, strsplit(c(a, b), split = "")), collapse = "")

但是获得的结果不是我期望的！

#IvysTENOP

Answer 1

对于这种情况，可以使用gsub。

> a <- "#IvoryCoast TENNIS US OPEN Clément «Un beau combat» entre Simon et Cilic"
> b <- "Clément «Un beau combat» entre Simon et Cilic"
> gsub(b, "", a)
[1] "#IvoryCoast TENNIS US OPEN "

Answer 2

您可以根据paste/reduce解决方案进行操作：

paste(Reduce(setdiff, strsplit(c(a, b), split = " ")), collapse = " ")
#[1] "#IvoryCoast TENNIS US OPEN"

或者，如果您想使用setdiff和strsplit来分隔项目：

setdiff(strsplit(a," ")[[1]],strsplit(b," ")[[1]])
#[1] "#IvoryCoast" "TENNIS"      "US"          "OPEN"

提取所有出现的两个字符串之间不同的字符

问题描述

2 个解决方案

解决方案1
4 2015-03-04 07:49:33

解决方案2
1 已采纳 2015-03-04 07:51:45

提取所有出现的两个字符串之间不同的字符

问题描述

2 个解决方案

解决方案1 4 2015-03-04 07:49:33

解决方案2 1 已采纳 2015-03-04 07:51:45

解决方案1
4 2015-03-04 07:49:33

解决方案2
1 已采纳 2015-03-04 07:51:45