簡體   English   中英

Windows Phone Web抓取

[英]Windows phone Web scraping

我正在嘗試從網頁上抓取數據。 通過使用HtmlAgility包,我可以加載要顯示的特定div。 但是在這個div節點內還有其他子/子節點。 如何提取每個子節點的innerhtml? 這是我所做的:

var webget = new HtmlWeb();
var doc = webget.Load("http://www.dmp.gov.bd/application/index/pressdetails/press_159");

HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='span8 inner_mess']");

在這里,我指的是一個特定的網頁。 它不會一直相同,但是可以確認div相同,並且在該div中,根據URL,將有不同的子節點。

如果我能以某種方式找出通過代碼在該特定div中可用的子節點,那么我可以進行一些整理。

您是否要遞歸跟蹤節點? (我不能說這是否可行,因為我只會說英語)。 您可以添加縮進和回車符以使其漂亮。

private void button1_Click(object sender, EventArgs e)
{
    var webget = new HtmlWeb();
    var doc = webget.Load("http://www.dmp.gov.bd/application/index/pressdetails/press_159");

    HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='span8 inner_mess']");

    TraverseNodes(node.ChildNodes);
}

private void TraverseNodes(HtmlNodeCollection nodes)
{
    foreach (HtmlNode node in nodes)
    {
        textBox1.Text += node.InnerText;

        TraverseNodes(node.ChildNodes);
    }
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM