![](/img/trans.png)
[英]Web Scraping Event Handler Gets Stuck after pressing the “START” button - Windows Phone 7
[英]Windows phone Web scraping
我正在嘗試從網頁上抓取數據。 通過使用HtmlAgility包,我可以加載要顯示的特定div。 但是在這個div節點內還有其他子/子節點。 如何提取每個子節點的innerhtml? 這是我所做的:
var webget = new HtmlWeb();
var doc = webget.Load("http://www.dmp.gov.bd/application/index/pressdetails/press_159");
HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='span8 inner_mess']");
在這里,我指的是一個特定的網頁。 它不會一直相同,但是可以確認div相同,並且在該div中,根據URL,將有不同的子節點。
如果我能以某種方式找出通過代碼在該特定div中可用的子節點,那么我可以進行一些整理。
您是否要遞歸跟蹤節點? (我不能說這是否可行,因為我只會說英語)。 您可以添加縮進和回車符以使其漂亮。
private void button1_Click(object sender, EventArgs e)
{
var webget = new HtmlWeb();
var doc = webget.Load("http://www.dmp.gov.bd/application/index/pressdetails/press_159");
HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='span8 inner_mess']");
TraverseNodes(node.ChildNodes);
}
private void TraverseNodes(HtmlNodeCollection nodes)
{
foreach (HtmlNode node in nodes)
{
textBox1.Text += node.InnerText;
TraverseNodes(node.ChildNodes);
}
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.