繁体   English   中英

如何在C#中抓取使用脚本生成的页面?

[英]How to scrape a page generated with a script in C#?

简单示例:Google搜索页面。

http://www.google.com/search?q=foobar

获取页面源代码后,便获得了底层JavaScript。 我想要结果页面。 我该怎么办?

即使看起来好像只是javascript,它实际上是完整的HTML,也可以使用HtmlAgilityPack轻松确认:

HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPack.HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load("http://www.google.com/search?q=foobar");
string html = doc.DocumentNode.OuterHtml;
var nodes = doc.DocumentNode.SelectNodes("//div"); //returns 85 nodes

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM