簡體   English   中英

收集html文件中使用的所有js css和img資源

[英]collect all the js css and img resources used in a html file

我想寫一個npm包來本地化一個HTML網址。
1.使用html url下載html頁面
2.解析html文件,提取html中使用的所有js,css和img文件以及本地這些資源。
3.如果這些js,css和img文件使用一些外部資源,則本地化這些資源。 例如,在css中提取背景圖像。

第一和第二個要求很容易滿足。 但我不知道最后一個。 我可以解析所有的css文件並本地化其中使用的資源。 但是我如何解析js文件?
例如:如果js在html dom中添加了'script src = XXX'標簽,我該如何提取src?

我想我會嘗試使用無頭瀏覽器來捕獲每個網絡調用而不是嘗試解析代碼。

我沒有親自使用它,但PhantomJS似乎符合要求。

它可用於加載網頁,然后執行通常在請求上發生的任何腳本/ css,並在頁面加載后執行。

網絡監控功能可能是您想要使用的功能。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM