正則表達式用兩個以上連續字符替換單詞

Question

如何檢測一個單詞中存在兩個以上連續字符並刪除該單詞？

我似乎能夠做到這一點：

# example data
mystring <- c(1, 2, 3, "toot", "tooooot")
# clunky regex
gsub("^[[:alpha:]]$", "", gsub(".*(.)\\1+\\1", "", mystring)) 
[1] "1"    "2"    "3"    "toot" ""

但我敢肯定，有一種更有效的方法。 我只用一個gsub怎么做？

Answer 1

像這樣組合表達式：

gsub("^[[:alpha:]]*([[:alpha:]])\\1\\1[[:alpha:]]*$", "", mystring)

Answer 2

您可以改用grepl 。

mystring <- c(1, 2, 3, "toot", "tooooot", "good", "apple", "banana")
mystring[!grepl("(.)\\1{2,}", mystring)]
## [1] "1"      "2"      "3"      "toot"   "good"   "apple"  "banana"

**說明**
\\\\1匹配第一個組（在這種情況下為(.) ）。 {2,}指定前面的字符至少應匹配2次或更多次。 由於我們要匹配重復3次或更多次的任何字符-第一次出現(.) ，因此\\\\1需要匹配2次或更多次。

Answer 3

另一種可能性：

mystring[grepl("(.{1})\\1{2,}", mystring, perl=T)] <- ""

正則表達式用兩個以上連續字符替換單詞

問題描述

3 個解決方案

解決方案1
4 2013-04-30 07:17:46

解決方案2
4 已采納 2013-04-30 07:23:39

解決方案3
0 2013-04-30 07:31:49

正則表達式用兩個以上連續字符替換單詞

問題描述

3 個解決方案

解決方案1 4 2013-04-30 07:17:46

解決方案2 4 已采納 2013-04-30 07:23:39

解決方案3 0 2013-04-30 07:31:49

解決方案1
4 2013-04-30 07:17:46

解決方案2
4 已采納 2013-04-30 07:23:39

解決方案3
0 2013-04-30 07:31:49