簡體 English 中英

我應該為 python 爬蟲使用無限循環還是 cron 作業？

[英]Should I use an infinite loop or a cron job for a python crawler?

原文 2021-05-14 20:24:49 5 1 python/ cron/ web-crawler

我在 python 中編寫了一個爬蟲，它遍歷 60 個網站，解析 HTML，並將數據保存到數據庫。

現在我正在使用 cron 作業每 15 分鍾運行一次爬蟲。 問題是我無法知道爬蟲完成需要多少時間（有時可能需要超過 15 分鍾），如果一個爬蟲已經在運行，我不想運行另一個爬蟲。

我一直在想我是否會更好地使用無限循環並使爬蟲成為一個始終運行的永久進程（但是我如何確保爬蟲不會失敗並退出？以及如何在每次退出時重新啟動它？） .

哪個效率更高？ 無限循環或cron作業？

1 個解決方案

您可以嘗試simple_scheduler 。 使用周期為 20 分鍾的循環調度程序 [假設 20 分鍾是最長的時間]。

from simple_scheduler.recurring import recurring_scheduler
recurring_scheduler.add_job(target=crawler_function, period_in_seconds=20*60)
recurring_scheduler.run()

優點是：

每 20 分鍾后，將實例化另一個爬蟲。
如果發生錯誤，以后對爬蟲的調用不會受到影響。 代碼仍然運行。

我應該如何使用“繼續”命令來避免 python 中的無限循環？

[英]How should I use a 'continue' command to avoid an infinite loop in python?

Python簡單的Web搜尋器錯誤（無限循環搜尋）

[英]Python simple web crawler error (infinite loop crawling)

當我使用無限循環時，Python GUI關閉

[英]Python GUI shuts down when i use infinite loop

Python：我陷入了無限循環

[英]Python: I fell in an infinite loop

哪個更適合發送通知，python循環/計時器或作為cron作業？

[英]Which is better to send notifications, a python loop/timer, or as a cron job?

Python Cron作業記錄

[英]Python cron job logging

Python Cron作業失敗

[英]Python cron job failing

Cron Job Python腳本

[英]Cron Job Python Script

Python Cron作業未執行

[英]Python Cron job not executed

我應該使用 for 循環還是 while 循環在 python 中制作一個中斷計時器？

[英]should i use for loop or while loop to make a break timer in python?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 我應該如何使用“繼續”命令來避免 python 中的無限循環？ Python簡單的Web搜尋器錯誤（無限循環搜尋）當我使用無限循環時，Python GUI關閉 Python：我陷入了無限循環哪個更適合發送通知，python循環/計時器或作為cron作業？ Python Cron作業記錄 Python Cron作業失敗 Cron Job Python腳本 Python Cron作業未執行我應該使用 for 循環還是 while 循環在 python 中制作一個中斷計時器？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM