簡體   English   中英

如何將網頁快照及其所有元素(css、js、圖像等)保存到一個文件中

[英]How to save a web page snapshot with all its elements (css, js, images, ...) into one file

如何以編程方式將網頁快照及其所有元素(css、js、圖像等)保存到一個文件中?

我需要定期存檔一些網頁。 然而,僅僅保存他們的 HTML 代碼是沒有用的——不僅是因為圖像丟失,尤其是因為圖像丟失。 因為當今頁面上缺少 CSS 可能會將網頁變成無法識別的混亂。

我記得 .mht 格式是這樣工作的,但這需要手動保存,這只是 IE 的一個功能。 我相信有一個開源解決方案可以以編程方式實現這一點,但盡管搜索了數小時,我還是無法在網絡上找到它。

在終端中使用 wget

wget -p -k http://www.example.com/

它將克隆站點前端的 html、css、js、svg 等。但不是按要求在一個文件中。 相反,它會重新創建整個文件夾結構

例如,如果www.example.com文件夾結構是

 /css/*
 /js/*
 /index.html

然后它會在本地創建相同的結構。

文檔: https : //www.gnu.org/software/wget/manual/wget.html

我認為@reisio (+1) 已經涵蓋了您...

...但如果只是為了插入一個很棒的免費工具,我會指出 Firefox 擴展Save Complete ,它在臨時抓取“完整”頁面方面做得非常出色。 輸出將是一個單獨的 HTML 文件,附帶一個包含所有資源的目錄 - 您可以輕松地將它們壓縮以進行存檔。

這並非沒有錯——我最近在 OSX 上遇到了損壞的.png文件的問題,但我經常使用它來從實時頁面構建模型,這是一個巨大的節省時間。 (另外請注意,FF 4 還沒有更新,這是我回滾到 3.6 的唯一原因)

Apple 的 Safari 有一個很好的解決方案。 它保存了所有 HTML 和 CSS(遺憾的是沒有 JS),但是以一種稱為 webarchive 的格式保存。 它是一個文件,但它需要 Safari 來保存和打開,而 Safari 需要一台 Mac。 盡管 Safari for Windows確實存在,但它太舊而無法處理網頁,它甚至不支持另存為 webarchive 或打開它們。 如果您使用的是 Mac,請在 Safari 中打開任何網站並按 ⌘S,然后確保 Web Archive 出現在下拉列表中。

還有一個Chrome 擴展程序可以打開這些類型的文件,但不能保存它們。

抱歉回復這么舊的帖子,只是想傳播這個信息!

如果您使用的是 Google Chrome,只需將保存頁面用作菜單項 (CTRL + s),然后從文件對話框底部的選項中選擇完整的網站。 這將保存 HTML 和所有必需的資源(在單獨的文件夾中)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM