给定一个字符串，如何使用 JavaScript 删除除特定“标签”（及其“子项”）之外的所有“HTML 标签”？

Question

给定一个类似于 HTML （但实际上不是 HTML）的字符串，我如何使用 JavaScript 删除除特定“标签”（及其“子项”）之外的所有“HTML 标签”？

例如，如果我有以下字符串：

'<p><span>Sample data: <math><msqrt><mo>y</mo></msqrt></math></span> <div><strong>hello world</strong><math><msqrt><mo>x</mo></msqrt></math></div></p>'

而且我只想保留原始文本和“数学标签”（以及每个“数学标签”中的所有内容），我该怎么做？

const html = '<p><span>Sample data: <math><msqrt><mo>y</mo></msqrt></math></span> <div><strong>hello world</strong><math><msqrt><mo>x</mo></msqrt></math></div></p>';
const result = stripNonSpecifiedHTML(html, 'math');
// expected result:
// 'Sample data: <math><msqrt><mo>y</mo></msqrt></math>hello world<math><msqrt><mo>x</mo></msqrt></math>'

function stripNonSpecifiedHTML(html, tagNameToKeep) {
   // ...
}

Answer 1

你可以做一些类似的事情：

html.split('<math>')[1].split('</math>')[0]

Answer 2

它看起来很糟糕，但它确实有效（有一些限制）：

用<math>和</math>分割字符串
每隔一个元素删除所有 html 标签
在每个第二个元素周围添加<math>和</math>
将数组连接回字符串

 const html = '<p><span>Initial data: <math><msqrt><mo>y</mo></msqrt></math></span> <div><strong>hello world</strong><math><msqrt><mo>x</mo></msqrt></math></div></p>' var text = html.split('<math>') .map(t => t.split('</math>')).flat() .map((t, i) => {return (i % 2==0 ) ? t.replace(/<.+?>/g,''): t }) .map((t, i) => {return (i % 2==0 ) ? t : '<math>' + t + '</math>' }) .join(''); console.log(text); // OUTPUT: Initial data: <math><msqrt><mo>y</mo></msqrt></math> hello world<math><msqrt><mo>x</mo></msqrt></math>

Answer 3

虽然不是html ，但可以将此字符串解析为xml 。

const html = '<p><span>Initial data: <math><msqrt><mo>y</mo></msqrt></math></span> <div><math><msqrt><mo>x</mo></msqrt></math></div></p>';

let parser = new DOMParser(),
    xmlDoc = parser.parseFromString(html, 'text/xml');

然后，您可以循环遍历所有<math>标签。

let mathTags = xmlDoc.getElementsByTagName('math');
Array.from(mathTags).forEach(math => {
    let data = math.innerHTML,
        content = math.textContent;
});

给定一个字符串，如何使用 JavaScript 删除除特定“标签”（及其“子项”）之外的所有“HTML 标签”？

问题描述

3 个解决方案

解决方案1
1 2020-10-14 22:01:09

解决方案2
1 已采纳 2020-10-14 22:53:28

解决方案3
0 2020-10-14 21:57:59

给定一个字符串，如何使用 JavaScript 删除除特定“标签”（及其“子项”）之外的所有“HTML 标签”？

问题描述

3 个解决方案

解决方案1 1 2020-10-14 22:01:09

解决方案2 1 已采纳 2020-10-14 22:53:28

解决方案3 0 2020-10-14 21:57:59

解决方案1
1 2020-10-14 22:01:09

解决方案2
1 已采纳 2020-10-14 22:53:28

解决方案3
0 2020-10-14 21:57:59