[英]Scheduling Scrapy spider runs at an interval from script
假設我有一個蜘蛛,我需要多次跑步
class My_spider(Scrapy.spider):
#spider def
我想做這樣的事情
while True:
runner = CrawlerRunner()
deferred = runner.crawl(My_spider)
deferred.addBoth(lambda _: reactor.stop())
reactor.run()
time.sleep(180)
有沒有辦法做到這一點? 我認為我已經用Google搜索了12個小時以上,而我嘗試的所有方法都無法正常工作,或者遇到了ReactorNotRestartable或其他問題。 此時,我正在考慮僅編寫一個單獨的模塊,該模塊將安排控制台命令。
使用計划模塊而不是時間。 這是你怎么做
import schedule
schedule.every(1).minute.do(runner.crawl(My_spider))
while True:
schedule.run_pending()
這將每1分鍾運行一次抓取功能。 在此處了解有關此庫的更多信息
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.