簡體   English   中英

抓取需要觸發javascript的外部網站

[英]scrape external website that requires javascript being triggered

由於phantomjs被放棄,我想知道是否還有其他方法。 例如chrome-webdriver並不是一個好的解決方案,因為它無法在諸如heroku之類的遠程主機上運行。

因此,是否有可能以某種方式抓取需要首先觸發javascript的外部網站? 注意,應該可以從nodejs應用程序運行它。

我已經准備好為您准備一些東西,然后我想到了更好的方法並用谷歌搜索了它。 查看此構建腳本; 它似乎完全可以回答您的問題。

https://github.com/stomita/heroku-buildpack-phantomjs

設置一個git分支,如果需要的話,將其拉到本地,但這應該可行。 基本上,您需要下載二進制文件,然后遠程下載並運行“ heroku run'phantomjs'”或“ heroku run'bin / phantomjs'”

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM