簡體 English 中英

分布式爬蟲和一致性

[英]distributed crawler and consistency

原文 2019-06-04 14:17:30 8 1 mysql/ perl/ redis/ web-crawler/ data-consistency

情況是，我們有多個服務器（40多個）來同時刮取一個相同的URL（以確保我們擁有最小的舊版）並將數據保存到數據庫（MySQL）中。

現在的問題是：數據來回切換。 例如，由於搜尋器/數據庫的遺留問題，其內容在幾秒鍾之內就是A <-> B <-> A <-> B <->A。

有預防的好方法嗎？ 我們正在用Perl編寫爬蟲程序，但是任何一種語言對我們都可以，因為我們可以借鑒這個想法。

任何提示將不勝感激。 Redis？ ZeroMQ？

謝謝

1 個解決方案

鎖定一行，以便其他進程無法更新它。

CouchDB與關系數據庫中的分布式一致性？

[英]Distributed consistency in CouchDB vs relational databases?

我可以對爬蟲使用分布式數據庫嗎？

[英]Can i use Distributed Database for a crawler?

分發時，NoSql類型解決方案如何支持一致性？

[英]How do NoSql type solutions support consistency when distributed?

Web搜尋器的哪個數據庫，以及如何在分布式環境中使用MySQL？

[英]Which database for a web crawler, and how do I use MySQL in a distributed environment?

MySQL密碼一致性

[英]MySQL password consistency

“中間一致性”事務失敗

[英]"Intermediate Consistency" transaction fail

APC緩存一致性問題

[英]APC Cache Consistency Problem

MySQL GTID 一致性違規

[英]MySQL GTID consistency violation

網絡搜尋器無法正常工作

[英]web crawler not working properly

搜尋器可以在此服務器配置上工作嗎？

[英]Will a crawler work on this server configuration?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 CouchDB與關系數據庫中的分布式一致性？我可以對爬蟲使用分布式數據庫嗎？分發時，NoSql類型解決方案如何支持一致性？ Web搜尋器的哪個數據庫，以及如何在分布式環境中使用MySQL？ MySQL密碼一致性 “中間一致性”事務失敗 APC緩存一致性問題 MySQL GTID 一致性違規網絡搜尋器無法正常工作搜尋器可以在此服務器配置上工作嗎？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM