C# Web 抓取：读取动态加载 ajax 内容由 Z2567A5EC9705EB71AC2C984033E 浏览器控制

Question

这就是我尝试的方式。 我将 web 站点加载到 web 浏览器控件中。 当用户向下滚动时，web 站点会加载更多数据。

此 web 站点通过 ajax 动态加载数据。 我尝试读取 ajax 加载的所有动态H3 标签，但我的代码不起作用。 无法理解我的代码中缺少什么。

这是我的代码

private void BrowserTest_Load(object sender, EventArgs e)
{
    webBrowser1.Navigate("https://www.pinterest.com/pin/517210338432366716/");
}

private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
    if (webBrowser1.ReadyState == WebBrowserReadyState.Complete)
    {
        HtmlElement elm = webBrowser1.Document.GetElementById("h3"); // Get "abc" element by ID
        //Console.WriteLine("elm.InnerHtml(DocumentCompleted):" + elm.InnerHtml);
        if (elm != null)
        {
            elm.AttachEventHandler("onpropertychange", new EventHandler(handler));
        }
    }
}

private void handler(Object sender, EventArgs e)
{
    HtmlElement div = webBrowser1.Document.GetElementById("h3");
    if (div == null) return;
    String contentLoaded = div.InnerHtml;
}

private void btnScrollDown_Click(object sender, EventArgs e)
{
    if (webBrowser1.Document != null)
    {
        webBrowser1.Document.Window.ScrollTo(0, webBrowser1.Document.Body.ScrollRectangle.Height);
    }
}

寻找建议如何实现我的目标。 谢谢

Answer 1

我会为此选择一种更不同的方式；

将文档滚动到底部
等待 100 毫秒（或 200 毫秒、500 毫秒，您的选择..）
计算文档中加载的网格元素总数
从第 1 步开始重复此操作； 直到; 如果加载的网格元素计数在最后 5 秒内没有变化。 在这种情况下，它可能是所有项目的结尾，因此请获取文档中的所有网格元素。

C# Web 抓取：读取动态加载 ajax 内容由 Z2567A5EC9705EB71AC2C984033E 浏览器控制

问题描述

这是我的代码

1 个解决方案

解决方案1
0 2020-07-10 21:10:42

C# Web 抓取：读取动态加载 ajax 内容由 Z2567A5EC9705EB71AC2C984033E 浏览器控制

问题描述

这是我的代码

1 个解决方案

解决方案1 0 2020-07-10 21:10:42

解决方案1
0 2020-07-10 21:10:42