繁体   English   中英

asp.net C#获取网页的最终页面来源

[英]asp.net C# get final page source of a webpage

我正在尝试获取网页的最终来源。 我正在使用webclient openRead方法,但是此方法仅返回初始页面源。 在下载源代码之后,有一个JavaScript可以运行并以另一种格式收集我需要的数据,而我的方法将寻找完全改变的东西。 我在说的就像之间的区别一样:

  1. 右键单击网页->选择查看源
  2. 访问开发人员工具

查看此站点以了解我在说什么: http : //www.augsburg.edu/history/fac_listing.html,并观察如何使用每个选项显示任何电子邮件。 我认为发生的是,第一个将向您显示页面的初始负载。 第二个将向您显示最后一页html。 网络客户端只允许我执行选项#1。

这是仅返回选项#1的代码。 哦,我需要从控制台应用程序执行此操作。 谢谢!

private static string GetReader(string site)
{
    WebClient client = new WebClient();
    try
    {
        data = client.OpenRead(site);
        reader = new StreamReader(data);
    }
    catch
    {
        return "";
    }
    return reader.ReadToEnd();
}

我已经找到解决问题的办法。 我最终使用了Selenium-WebDriver PageSource属性。 效果很好!

了解有关Selenium和Webdriver的信息。 这是一件容易学习的事情。 它有助于测试,并为此!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM