繁体   English   中英

在Google Apps脚本中分割HTML标签

[英]Stripe HTML tags in Google Apps Script

我正在寻找一种快速的方法来从Google Apps脚本的内容中剥离HTML标签。

现在,我正在使用以下功能进行HTML解析:

function getTextFromHtml(body) {
  return getTextFromNode(Xml.parse(body, true).getElement());
}

function getTextFromNode(x) {
 switch(x.toString()) {
  case 'XmlText': return x.toXmlString();
  case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
  default: return '';
 }
}

但是对于HTML而言,这种方式是如此低效。

示例HTML内容: http//pastebin.com/FmB4hvN2

有任何想法吗?

这将从输入中删除所有标签。

 var text = html.replace(/<[^>]+>/g, "");

如果您要替换的内容始终用<和>包裹,则可以

Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM