[英]Get HTML source code from browser control embedded in C#
我有一个嵌入在C#windows应用程序中的浏览器控件。 我想抓取渲染的HTML(可能是由javascript修改)而不是原始的。
有什么建议么?
您可以使用
WebBrowser.DocumentText
获取HTML,并确实设置它。
盛是正确的, DocumentText
在脚本运行之前返回流文档。 他的代码没有编译,但它基本上是正确的。 我发现你需要:
mshtml.HTMLDocument doc = webBrowser1.Document.DomDocument as mshtml.HTMLDocument;
string html = doc.documentElement.outerHTML;
DocumentText在内部使用文档的IPersistStream接口,该接口返回原始HTML。 请改用webBrowser1.Document.DocumentElement.OuterHTML。
将Navigated事件添加到WebBrowser。 只有这样才能填写您的文件。
private void webBrowser1_Navigated(object sender, WebBrowserNavigatedEventArgs e)
{
Console.WriteLine(webBrowser1.DocumentText);
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.