asp.net C＃获取网页的最终页面来源

Question

我正在尝试获取网页的最终来源。 我正在使用webclient openRead方法，但是此方法仅返回初始页面源。 在下载源代码之后，有一个JavaScript可以运行并以另一种格式收集我需要的数据，而我的方法将寻找完全改变的东西。 我在说的就像之间的区别一样：

右键单击网页->选择查看源
访问开发人员工具

查看此站点以了解我在说什么： http : //www.augsburg.edu/history/fac_listing.html，并观察如何使用每个选项显示任何电子邮件。 我认为发生的是，第一个将向您显示页面的初始负载。 第二个将向您显示最后一页html。 网络客户端只允许我执行选项＃1。

这是仅返回选项＃1的代码。 哦，我需要从控制台应用程序执行此操作。 谢谢！

private static string GetReader(string site)
{
    WebClient client = new WebClient();
    try
    {
        data = client.OpenRead(site);
        reader = new StreamReader(data);
    }
    catch
    {
        return "";
    }
    return reader.ReadToEnd();
}

Answer 1

我已经找到解决问题的办法。 我最终使用了Selenium-WebDriver PageSource属性。 效果很好！

了解有关Selenium和Webdriver的信息。 这是一件容易学习的事情。 它有助于测试，并为此！

asp.net C＃获取网页的最终页面来源

问题描述

1 个解决方案

解决方案1
0 2012-02-23 06:20:08

asp.net C＃获取网页的最终页面来源

问题描述

1 个解决方案

解决方案1 0 2012-02-23 06:20:08

解决方案1
0 2012-02-23 06:20:08