[英]How to scrape a page generated with a script in C#?
简单示例:Google搜索页面。
http://www.google.com/search?q=foobar
获取页面源代码后,便获得了底层JavaScript。 我想要结果页面。 我该怎么办?
即使看起来好像只是javascript,它实际上是完整的HTML,也可以使用HtmlAgilityPack轻松确认:
HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPack.HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load("http://www.google.com/search?q=foobar");
string html = doc.DocumentNode.OuterHtml;
var nodes = doc.DocumentNode.SelectNodes("//div"); //returns 85 nodes
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.