簡體   English   中英

復制 PostgreSQL 數據以進行分析

[英]Replicating PostgreSQL data for analytics

我目前正在尋找一個潛在的開發項目,我們將開發一個分析解決方案來支持生產應用程序。 顯然,我們希望對合理的最新數據運行查詢,但我們不希望直接使用(可能昂貴的)分析查詢查詢主數據庫的操作風險。

為此,我相信我們希望做到以下幾點:

  • 將“生產”PostgreSQL 數據庫的副本復制到單獨的“分析”數據庫中
  • 向“分析”數據庫添加額外的表/視圖等,這將僅支持分析解決方案,而不是應用程序數據庫的一部分。
  • 以合理的最新方式維護生產數據的副本(實時復制不是嚴格需要的,但延遲不超過幾秒就好了)

數據庫不會過大(它是一個擁有大量用戶但最不可能在任何時候都處於活動狀態的網絡/移動應用程序)。

這對於 PostgreSQL 是否可行,如果可行,最好使用的策略/復制技術是什么?

您不能為此使用流式復制,因為您無法將表添加到只讀數據庫。 但是您可能會重新考慮不向生產數據庫添加額外表的要求。

但是,還有其他復制技術,例如SlonyBucardoLondiste

您應該記住的一件事是,適用於在線事務處理數據庫的數據模型通常不太適合分析應用程序,並且您最終可能對分析查詢的性能非常不滿意。 對於這些,通常要做的是構建某種數據倉庫,其中數據以更加非規范化的形式存儲,通常以類似星型模式的形式存儲。

但為此你不能有“不超過幾秒鍾的延遲”。 仔細檢查這是否真的必不可少,它通常不適用於分析查詢。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM