使用Javascript（regex）查找不在HTML标记内的文本

Question

我有一个来自DOM元素的字符串，其中包含类似于以下内容：

<span class='greenhornet'>Can you catch the green?</span>

我需要知道绿色一词的位置。

在这种情况下，如果我设置了模式/green/ ，则JS exec()当然会返回绿色的第一个匹配项（位置13）。

有没有办法告诉JS正则表达式忽略! 单词green ，如果它介于<和>之间，或者有更简单的方法吗？

哦，我也不能只剥离HTML！

谢谢。

Answer 1

正如评论者（和user1883592）所建议的那样，在此处剥离HTML或从HTML中解析文本是正确的答案。 在HTML上使用正则表达式是失败者的游戏； 您已被警告。

但是，话虽如此，如果您真的想玩这个游戏，我首先要确保您的任期与最后一个结束括号之间没有任何括号。 换一种说法：

var greenRegex = />[^<]+(green)/;
var position = "<span class='greenhornet'>Can you catch the green?</span>".search(greenRegex);
// position = 25, not 13

Answer 2

您可以获取span元素的innerHTML。 无需正则表达式。

使用Javascript（regex）查找不在HTML标记内的文本

问题描述

2 个解决方案

解决方案1
2 2012-12-20 01:06:33

解决方案2
0 2012-12-20 00:17:57

使用Javascript（regex）查找不在HTML标记内的文本

问题描述

2 个解决方案

解决方案1 2 2012-12-20 01:06:33

解决方案2 0 2012-12-20 00:17:57

解决方案1
2 2012-12-20 01:06:33

解决方案2
0 2012-12-20 00:17:57