[英]How do i grab everything inside the BODY html tag (From a string) using RegEx Asp.net C#
{是的,上面或多或少解釋了它} :)
Regex oRegex = new Regex("<body.*?>(.*?)</body>", RegexOptions.Multiline);
如果身體中有任何屬性,上面似乎不起作用。
使用HTML Agility Pack (假設它是html,而不是xhtml):
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
string body = doc.DocumentNode.SelectSingleNode("/html/body").InnerHtml;
不要使用正則表達式。 使用旨在解析XML / HTML的東西:
XmlDocument.SelectSingleNode("//body").InnerXml;
將字符串加載到XmlDocument中 ,使用SelectSingleNode函數(將XPath表達式作為參數),然后從生成的XmlNode中提取所需內容。
我最終通過使用RegexOptions.Singleline
而不是使用RegexOptions.Multiline
解決了它
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.