簡體   English   中英

爬行速度慢(60頁/分鍾)

[英]Scrapy Crawling Speed is Slow (60 pages / min)

我遇到緩慢的抓取速度(大約1頁/秒)。 我正在從AWS服務器抓取主要網站,因此我認為這不是網絡問題。 Cpu利用率遠沒有達到100,如果我啟動多個抓取進程,爬網速度會更快。

Scrapy似乎爬了一堆頁面,然后掛了幾秒鍾,然后重復。

我試着玩:CONCURRENT_REQUESTS = CONCURRENT_REQUESTS_PER_DOMAIN = 500

但這似乎並不能使針頭移動超過20個。

您確定可以高速爬網目標站點嗎? 許多站點都實現下載閾值,並且“過一會兒”開始緩慢響應。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM