繁体   English   中英

如何使用htmlagilitypack从Raw html读取所有锚标签

[英]How to Read all anchor tags from Raw html using htmlagilitypack

这是我的html字符串

string htmlData="<!DOCTYPE html><html><Head></Head><body>&lt;div&gt;&lt;a target=\"_blank\" href=\"http://blender.palmbeachschools.org/GetFile.aspx?f=e9bf5637-c5bd-d4ba-3a1e-cf35ecfcad13\" style=\"font-family: Arial, Helvetica, sans-serif; font-size: large;\"&gt;Breakdown of Standards by Unit &lt;/a&gt;&lt;span style=\"font-size: large; font-family: Arial, Helvetica, sans-serif;\"&gt;&lt;br&gt;&lt;/span&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;/div&gt;</body></html>"

我必须从此html阅读所有锚标签。 这里的挑战是未解析所有锚标记。

我尝试使用

HtmlDocument doc = new HtmlDocument();          
doc.LoadHtml(htmltemp);
var pre = doc.DocumentNode.Descendants("a").FirstOrDefault();

它返回我为空。

       string htmlData = "<a href='1'>First</a><ul><li><a href='1'>Second</a></li><li><a href='1'>Third</a></li></ul>";
        HtmlDocument doc = new HtmlDocument();

        doc.LoadHtml(htmlData);
        var anchorTags = doc.DocumentNode.Descendants("a");

您可以使用此代码。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM