正则表达式中单词之间的 n 个字符

Question

我想使用正则表达式（在 R，版本 3.3.1 中）匹配以下模式：单词，最多 10 个字符的任何内容 - 单词。

我尝试了以下代码： "word1".{0,10}"word2"$和其他一些类似的组合，但没有成功。

以下是一些输出示例：

x <- c('word1 word2',           # TRUE
       'word1 bla word2',       # TRUE
       'word1 blablabla word2') # FALSE

等等

编辑：我尝试了您的所有建议，但没有一个有效。 我尝试从 DATA API 查询一些数据。 在查询部分，我必须写出我想要获取的内容。 例如这有效： query = list(q = paste0("\\"", "SomeSurname", ". ", "SomeName", ". ", "\\"", "~5", sep = "")) )，但是如果我想以姓名和姓氏之间最多可以有 10 个任意字符的方式添加约束，则它不起作用： query = list(q = paste0("\\"", prebivaliste[i,"prezime" ], ".{0,5}", prebivaliste[i,"ime"],"\\"", "~5", sep = "")))

Answer 1

我认为这应该符合您的要求：

(word1)(?:.){0,10}(word2)

(word1) - capture the literal text: "word1"
(?:.) - Set up non capturing group for any character
{0,10} - 0-10 times
(word2) - capture the literal text "word2"

grepl('(word1)(?:.){0,10}(word2)', x)
# [1]  TRUE  TRUE FALSE

假设您想捕获任何单词而不是 word1/word2，您可以使用\\\\w或\\\\w+来匹配

实例： https : //regex101.com/r/xJ3yZ2/1

Answer 2

也许这很简单：

nchar(gsub('word1|word2','',string))<=10
#[1]  TRUE  TRUE FALSE

正则表达式中单词之间的 n 个字符

问题描述

2 个解决方案

解决方案1
1 2016-09-21 16:23:01

解决方案2
0 2016-09-21 17:06:09

正则表达式中单词之间的 n 个字符

问题描述

2 个解决方案

解决方案1 1 2016-09-21 16:23:01

解决方案2 0 2016-09-21 17:06:09

解决方案1
1 2016-09-21 16:23:01

解决方案2
0 2016-09-21 17:06:09