繁体   English   中英

执行与其关联的JavaScript后,如何获取页面的源HTML?

[英]How do I get the source HTML for a page after executing its associated JavaScript?

关于该问题的帖子很少,但是似乎没有人真正回答我的问题。

我使用TIdHttp加载此网站的源代码: http : //www.nationalgeographic.com/

我尝试提取一些数据,但意识到该数据是由脚本生成的。 源代码中有一个脚本,还有一些指向外部js文件的链接。

我如何才能在页面上运行部分或全部脚本并获取生成的源代码?

我在辅助线程中使用此部分,并希望避免使用WebBrowser组件。

我可以从Idhttp生成的源代码中提取脚本或链接,但是使用idhttp.get(*.js)运行js文件,但我想这可能太简单了。

最后,答案很基本:

document := webBrowser.Document as IHTMLDocument2; result := document.body.innerHTML;

这将检索源代码并包括脚本在运行时动态生成的内容。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM