簡體   English   中英

刪除除一個標簽外的所有html標簽

[英]Remove All html tag except one tag

我有一些代碼刪除所有html標記,但是我想刪除所有html,但</td></tr>標記除外。

如何才能做到這一點?

public string HtmlStrip( string input)
{
    input = Regex.Replace(input, "<input>(.|\n)*?</input>", "*");
    input = Regex.Replace(input, @"<xml>(.|\n)*?</xml>", "*"); // remove all <xml></xml> tags and anything inbetween.  
    return Regex.Replace(input, @"<(.|\n)*?>", "*"); // remove any tags but not there content "<p>bob<span> johnson</span></p>" becomes "bob johnson"
}

正則表達式不適用於解析XML或HTML。 看看HTML Agility Pack

HTML敏捷包

刪除所有標簽html,但標簽td和tr除外

輸入= Regex.Replace(輸入,@“ <(?! td | / td | tr | / tr)。*?>”,“”);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM