繁体   English   中英

从嵌入在C#中的浏览器控件获取HTML源代码

[英]Get HTML source code from browser control embedded in C#

我有一个嵌入在C#windows应用程序中的浏览器控件。 我想抓取渲染的HTML(可能是由javascript修改)而不是原始的。

有什么建议么?

您可以使用 WebBrowser.DocumentText获取HTML,并确实设置它。

盛是正确的, DocumentText在脚本运行之前返回流文档。 他的代码没有编译,但它基本上是正确的。 我发现你需要:

mshtml.HTMLDocument doc = webBrowser1.Document.DomDocument as mshtml.HTMLDocument;
string html = doc.documentElement.outerHTML;

DocumentText在内部使用文档的IPersistStream接口,该接口返回原始HTML。 请改用webBrowser1.Document.DocumentElement.OuterHTML。

将Navigated事件添加到WebBrowser。 只有这样才能填写您的文件。

    private void webBrowser1_Navigated(object sender, WebBrowserNavigatedEventArgs e)
    {
        Console.WriteLine(webBrowser1.DocumentText);
    }

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM