簡體   English   中英

抓狂地管理多個蜘蛛

[英]Managing multiple spiders with scrapy

我正在創建一個聚合器,並以scrapy作為初始工具集開始。 首先,我只有幾個蜘蛛,但是隨着項目的發展,隨着我抓取越來越多的網站,似乎我可能擁有數百甚至上千種蜘蛛。 什么是管理這些蜘蛛的最佳方法,因為某些網站只需要爬網一次,而有些則需要定期爬網? 當處理如此多的網站時,抓癢仍然是一個很好的工具,或者您會推薦其他技術。

您可以從scrapy的創建者那里仔細地簽出項目。 但是,據我所知,它不適合解析包含javascript的網站(更確切地說,如果解析的數據不是由javascript生成的)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM