在字符串开头匹配字符，忽略html标签中的字符串

Question

需要一点帮助...

我有一个正则表达式，它匹配字符串开头的字符，如下所示：

如果我有一组像这样的字符串：

Ray Fox 
Foster Joe
Finding Forrester

正则表达式

/\bfo[^\b]*?\b/gi

这将按预期匹配Fox，Foster和Forrester中的“ FO”：

但是，我面临一个问题，如果将字符串集像这样用html标签包装；-

<span class="fontColor1">Ray Fox</span>
<span class="fontColor2">Foster Joe</span>
<span class="fontColor3">Finding Forrester</span>

这也将匹配fontColor *中的'FO'。

我对正则表达式相当满意，我需要一点帮助来更新查询，以便它仅在存在HTML标记的HTML标记之间搜索值，但是如果不存在HTML标记，则仍然可以正常工作。

Answer 1

关于什么

<.*?span.*?>(.*?)<\s?\/.*?span.*?>

在哪里有html标记不存在的文本？ 这是没有意义的。

编辑：

此解决方案将不匹配嵌套标签，但是在编写问题时，这似乎不是问题。

Answer 2

您可以使用html解析器提取纯文本，然后进行匹配。

var root;

try {
    root = document.implementation.createHTMLDocument("").body;
}
catch(e) {
    root = document.createElement("body");
}

root.innerHTML = '<span class="fontColor1">Ray Fox</span>\
            <span class="fontColor2">Foster Joe</span>\
            <span class="fontColor3">Finding Forrester</span>';

//If you are using jQuery
var text = $(root).text();

//Proceed as normal with the text variable

如果您不使用jQuery，则可以将$(root).text()替换$(root).text() findText(root) ，其中findText ：

function findText(root) {
    var ret = "",
        nodes = root.childNodes;
    for (var i = 0; i < nodes.length; ++i) {
        if (nodes[i].nodeType === 3) {
            ret += nodes[i].nodeValue;
        } else if (nodes[i].nodeType === 1) {
            ret += findText(nodes[i]);
        }
    }
    return ret;
}

在字符串开头匹配字符，忽略html标签中的字符串

问题描述

2 个解决方案

解决方案1
0 2012-12-17 15:36:11

解决方案2
0 已采纳 2012-12-17 15:38:50

在字符串开头匹配字符，忽略html标签中的字符串

问题描述

2 个解决方案

解决方案1 0 2012-12-17 15:36:11

解决方案2 0 已采纳 2012-12-17 15:38:50

解决方案1
0 2012-12-17 15:36:11

解决方案2
0 已采纳 2012-12-17 15:38:50