繁体   English   中英

正则表达式匹配两个相同字符串之间的所有字符串

[英]Regex to match all the strings between two identical strings

例如,我有这个字符串-- This -- is -- one -- another -- comment --我希望匹配的元素是“This”、“is”、“one”、“another”和“comment”

我正在尝试这个正则表达式--\\s+([^--]+)\\s+--它给了我匹配的元素作为“这个”、“一个”和“评论”

我已经搜索了其他问题,它们都提供了这样的解决方案,即#A#并且我会得到A但是对于#A#B#我也会得到A ,但在这种情况下我想要元素AB因为它们都介于两者之间两个#字符。

我正在为 javascript regex 测试它,但我认为解决方案应该与平台/语言无关。

通常,您需要使用类似的模式

STRING([\s\S]*?)(?=STRING|$)

它将匹配STRING ,然后将任何零个或多个字符捕获到 Group 1 中,尽可能少,直到第一次出现STRING *在这个词之前停止** 因为(?=...)是一个积极的前瞻,作为零宽度断言,不消耗匹配的文本或字符串的结尾。

该模式的一般变体是

STRING((?:(?!STRING)[\s\S])*)

它使用一个缓和的贪婪令牌(?:(?!STRING)[\\s\\S])* ,它匹配任何字符,0 次或多次出现,不开始STRING字符序列。

要获取当前解决方案中的所有子字符串,请使用类似的前瞻

/--\s+([\s\S]*?)(?=\s+--)/g
                ^^^^^^^^^

请参阅正则表达式演示

请注意, [^--]+匹配 1 个或多个除 a -之外的符号,它不匹配任何不等于--文本。 [...]是匹配单个字符的字符类。 要匹配从一个字符到模式第一次出现的任何长度的任何文本,您可以依赖[\\s\\S]*? 构造:任何 0+ 个字符,尽可能少(由于惰性*?量词)。

JS演示:

 var s = '-- This -- is -- one -- another -- comment --'; var rx = /--\\s+([\\s\\S]*?)(?=\\s+--)/g; var m, res=[]; while (m = rx.exec(s)) { res.push(m[1]); } console.log(res);

要阅读所有内容,我会使用积极的展望:

 const data = '-- This -- is -- one -- another -- comment --' const readAll = data => { const regex =/--\\s*(.*?)\\s*(?=--)/g const found = [] let temp while (temp = regex.exec(data)) { found.push(temp[1]) } return found } console.log(readAll(data))

要删除评论,只需执行以下操作:

 const data = `-- This -- is -- one -- another -- comment -- this is not a comment`.replace(/--.*--/g, '') console.log(data)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM