簡體   English   中英

在Google Apps腳本中分割HTML標簽

[英]Stripe HTML tags in Google Apps Script

我正在尋找一種快速的方法來從Google Apps腳本的內容中剝離HTML標簽。

現在,我正在使用以下功能進行HTML解析:

function getTextFromHtml(body) {
  return getTextFromNode(Xml.parse(body, true).getElement());
}

function getTextFromNode(x) {
 switch(x.toString()) {
  case 'XmlText': return x.toXmlString();
  case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
  default: return '';
 }
}

但是對於HTML而言,這種方式是如此低效。

示例HTML內容: http//pastebin.com/FmB4hvN2

有任何想法嗎?

這將從輸入中刪除所有標簽。

 var text = html.replace(/<[^>]+>/g, "");

如果您要替換的內容始終用<和>包裹,則可以

Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM