[英]How do I get the source HTML for a page after executing its associated JavaScript?
关于该问题的帖子很少,但是似乎没有人真正回答我的问题。
我使用TIdHttp加载此网站的源代码: http : //www.nationalgeographic.com/
我尝试提取一些数据,但意识到该数据是由脚本生成的。 源代码中有一个脚本,还有一些指向外部js文件的链接。
我如何才能在页面上运行部分或全部脚本并获取生成的源代码?
我在辅助线程中使用此部分,并希望避免使用WebBrowser组件。
我可以从Idhttp生成的源代码中提取脚本或链接,但是使用idhttp.get(*.js)
运行js文件,但我想这可能太简单了。
最后,答案很基本:
document := webBrowser.Document as IHTMLDocument2; result := document.body.innerHTML;
这将检索源代码并包括脚本在运行时动态生成的内容。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.