繁体   English   中英

收集html文件中使用的所有js css和img资源

[英]collect all the js css and img resources used in a html file

我想写一个npm包来本地化一个HTML网址。
1.使用html url下载html页面
2.解析html文件,提取html中使用的所有js,css和img文件以及本地这些资源。
3.如果这些js,css和img文件使用一些外部资源,则本地化这些资源。 例如,在css中提取背景图像。

第一和第二个要求很容易满足。 但我不知道最后一个。 我可以解析所有的css文件并本地化其中使用的资源。 但是我如何解析js文件?
例如:如果js在html dom中添加了'script src = XXX'标签,我该如何提取src?

我想我会尝试使用无头浏览器来捕获每个网络调用而不是尝试解析代码。

我没有亲自使用它,但PhantomJS似乎符合要求。

它可用于加载网页,然后执行通常在请求上发生的任何脚本/ css,并在页面加载后执行。

网络监控功能可能是您想要使用的功能。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM