簡體   English   中英

如何將使用javascript的網頁轉換為純HTML?

[英]How can I convert web page with javascript to plain html?

我想將一些使用javascript的網頁轉換為純html,然后發現了幾種方法(請告訴我是否錯誤):

  1. 以Jython為例: http : //blog.databigbang.com/web-scraping-ajax-and-javascript-sites/
  2. 將Java與htmlunit一起使用
  3. 使用代理,例如: http : //grep.codeconsult.ch/2007/02/24/crowbar-scrape-javascript-generated-pages-via-gecko-and-rest/
  4. 將python與qt或PyV8一起使用

因為我想制作一個微型工具來滿足我的要求,並且我認為安裝V8和qt有點復雜,盡管python是我的首選。

所以我試圖用壁虎做代理,但是似乎需要一個在遠程Linux服務器上買不起的DISPLAY。

現在,我正在嘗試使用jython,但是似乎沒有簡單的方法可以將整個頁面轉換為純HTML。

其實,我想問問有沒有辦法像瀏覽器一樣將包含javascript的網頁轉換為純html。 node.js可以完成這項工作嗎?

我最近在PhantomJS之上構建了一個服務器來執行此操作。 我強烈推薦這條路線。

http://phantomjs.org/

基本上,您編寫了一個使PhantomJS運行頁面的快速腳本,並配置了一個觸發方法,該方法使您知道頁面已完成並發送數據。 我的版本使用內置的HTTP服務器,因此PhantomJS可以輕松地自行提供結果。 這大約需要15行代碼。 (對不起,不能在這里粘貼它……在工作時間寫出來。但是,請在他們的主頁上查看示例。它幾乎完成了!)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM