[英]Is there anyway Express in Node.js can have more than one static folder?
[英]Is it ideal to have more than one phantomjs worker spawned from node.js?
我們正在使用phantomjs來截取各種網頁的屏幕快照,URL是由node.js服務器中的客戶端發送的,而該服務器又生成phantomjs來截取屏幕快照並發送base64圖像。 產生多個phantomjs工人來完成這項工作是否理想? 如果有5個客戶端請求,則將有5個產生的進程。 無論客戶端請求的數量如何,我將數量限制為5。 但是5個產生的進程是否也在服務器上推送了它?
要回答您的問題: 是的 ,運行多個PhantomJS worker完全可以。 對於我的碩士論文,我爬了超過一百萬個網站,並使用了多個工作人員(也來自Node.js)。
要檢查系統中有多少工作人員可行,可以使用nload
和htop
工具(對於Linux)。 nload
向您顯示網絡使用情況, htop
向您顯示內存和CPU使用情況。 只需啟動一些PhantomJS實例以爬網某些頁面並監視資源的使用以檢查限制。
您可能還需要檢出phantomjs-pool庫(免責聲明:我是作者),因為它可以幫助您將作業排隊,還可以處理各種錯誤可能性和超時。
我從抓取過程中得到的一些發現:
舉個例子:在我的設置中,我被限制為8 MBit / s的吞吐量,這導致使用了四個工作程序。
所有這些值都是我進行爬網過程的結果,當然對於不同的網站可能會有很大差異。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.