[英]Stripe HTML tags in Google Apps Script
我正在尋找一種快速的方法來從Google Apps腳本的內容中剝離HTML標簽。
現在,我正在使用以下功能進行HTML解析:
function getTextFromHtml(body) {
return getTextFromNode(Xml.parse(body, true).getElement());
}
function getTextFromNode(x) {
switch(x.toString()) {
case 'XmlText': return x.toXmlString();
case 'XmlElement': return x.getNodes().map(getTextFromNode).join('');
default: return '';
}
}
但是對於HTML而言,這種方式是如此低效。
示例HTML內容: http : //pastebin.com/FmB4hvN2
有任何想法嗎?
這將從輸入中刪除所有標簽。
var text = html.replace(/<[^>]+>/g, "");
如果您要替換的內容始終用<和>包裹,則可以
Regex rgx = new Regex(someString);
string result = rgx.Replace("<[^>]*>", "");
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.