[英]asp.net C# get final page source of a webpage
我正在尝试获取网页的最终来源。 我正在使用webclient openRead方法,但是此方法仅返回初始页面源。 在下载源代码之后,有一个JavaScript可以运行并以另一种格式收集我需要的数据,而我的方法将寻找完全改变的东西。 我在说的就像之间的区别一样:
查看此站点以了解我在说什么: http : //www.augsburg.edu/history/fac_listing.html,并观察如何使用每个选项显示任何电子邮件。 我认为发生的是,第一个将向您显示页面的初始负载。 第二个将向您显示最后一页html。 网络客户端只允许我执行选项#1。
这是仅返回选项#1的代码。 哦,我需要从控制台应用程序执行此操作。 谢谢!
private static string GetReader(string site)
{
WebClient client = new WebClient();
try
{
data = client.OpenRead(site);
reader = new StreamReader(data);
}
catch
{
return "";
}
return reader.ReadToEnd();
}
我已经找到解决问题的办法。 我最终使用了Selenium-WebDriver PageSource属性。 效果很好!
了解有关Selenium和Webdriver的信息。 这是一件容易学习的事情。 它有助于测试,并为此!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.